曾經(jīng)只有對(duì)話功能的聊天機(jī)器人,正在進(jìn)化為“有手、有腦、有眼睛”的自主 Agent(智能體)。11月29日,智譜在其Agent OpenDay上公布了智能體方面的最新進(jìn)展,其研制的智能體AutoGLM可以自主執(zhí)行超過(guò)50步的長(zhǎng)步驟操作,并能夠跨APP執(zhí)行任務(wù)。當(dāng)日,AutoGLM啟動(dòng)大規(guī)模內(nèi)測(cè),“會(huì)盡快上線成為真正面向廣大C端用戶開放的產(chǎn)品”,公司CEO張鵬說(shuō)。 在現(xiàn)場(chǎng)下達(dá)一個(gè)簡(jiǎn)單的語(yǔ)音指令后,張鵬動(dòng)了動(dòng)嘴吩咐自己的智能體給在場(chǎng)的數(shù)百位嘉賓發(fā)送一個(gè)具體金額和數(shù)量的紅包,它手機(jī)上的AutoGLM智能體隨即開始執(zhí)行打開微信、進(jìn)入紅包界面輸入相應(yīng)數(shù)額等操作,而張鵬只需要在確認(rèn)支付環(huán)節(jié)輸入密碼,幾秒鐘后,現(xiàn)場(chǎng)嘉賓的聊天群里就收到了這個(gè)紅包。 在演示視頻中,當(dāng)智能體接到“幫我看看哪個(gè)外賣APP上附近的肯德基全家桶最便宜并幫我下單”這一指令后,AutoGLM自動(dòng)打開了手機(jī)上的外賣APP、搜索商品、進(jìn)入店鋪、挑選商品、加入購(gòu)物車并記錄價(jià)格,再打開另一個(gè)外賣APP并進(jìn)行了同樣的操作后,將對(duì)比結(jié)果展現(xiàn)給人類用戶并得到認(rèn)可后完成了下單。 “給某某聊天群里所有人的第一條朋友圈點(diǎn)個(gè)贊”“幫我在小紅書查一下火鍋需要哪些食材,去小象超市全部采購(gòu)回來(lái)”諸如這樣需要使用多個(gè)APP完成的任務(wù),智能體都能順利完成。在采購(gòu)火鍋食材的例子中,從打開小紅書、搜索文章、提取文章內(nèi)容,到打開外賣APP、搜索并加購(gòu)多種商品后下單,AutoGLM自主執(zhí)行了 54步無(wú)打斷操作。 智能體不僅能操作手機(jī),也能操作電腦,或是完成電腦、手機(jī)聯(lián)動(dòng)的場(chǎng)景,對(duì)電子產(chǎn)品進(jìn)行“無(wú)人駕駛”。例如,當(dāng)上班族在下班后收到老板索要某文件的要求后,可以通過(guò)手機(jī)告訴智能體:“把電腦上的某某研報(bào)文件微信發(fā)送給老板”,基于電腦的智能體GLM-PC就能完成操作。 “AutoGLM和GLM-PC是我們邁向AI智能操作系統(tǒng)的重要嘗試?!睆堸i說(shuō)。據(jù)其對(duì)大模型發(fā)展五個(gè)階段的定義,L1 語(yǔ)言能力、L2 邏輯能力(多模態(tài)能力)、L3 使用工具的能力、 L4 自我學(xué)習(xí)能力、 L5 探究科學(xué)規(guī)律。張鵬認(rèn)為,發(fā)展至今,大模型已經(jīng)初步具備了人類與現(xiàn)實(shí)物理世界互動(dòng)的部分能力?!癆gent 將極大地提升 L3 使用工具能力,同時(shí)開啟對(duì) L4 自我學(xué)習(xí)能力的探索?!彼f(shuō),未來(lái)將繼續(xù)加速Agent模型產(chǎn)品的研發(fā),期待著一句話操作電腦和手機(jī)的范式盡快到來(lái)。 放眼全球,蘋果(Apple Intelligence)、Anthropic(Computer Use)、谷歌(Jarvis)和 OpenAI(Operator)等企業(yè)已經(jīng)把智能體作為2025年的主要關(guān)注點(diǎn)。業(yè)內(nèi)普遍認(rèn)為,2025年將是智能體爆發(fā)之年。Gartner近期將Agentic AI (代理式人工智能)列為2025年十大技術(shù)趨勢(shì)之一,并預(yù)測(cè)2028年至少有15%的日常工作決策將由Agentic AI自主完成,而這一數(shù)字在2024年為0。 來(lái)源:北京日?qǐng)?bào)客戶端 記者:孫奇茹 |
19款電子扎帶
電路板識(shí)別電子標(biāo)簽