隨著大模型迭代的浪潮一波接一波地推高技術(shù)前沿,Agent技術(shù)已經(jīng)成為大模型落地的主流選擇,并被視為賦予大模型更廣闊能力的最佳路徑。從理解復(fù)雜的指令,到處理多模態(tài)信息,從簡(jiǎn)單的問(wèn)答系統(tǒng)到復(fù)雜的決策支持系統(tǒng),從個(gè)性化推薦到自動(dòng)化的業(yè)務(wù)流程管理,陸續(xù)在更多領(lǐng)域展現(xiàn)出其巨大的潛力和價(jià)值,它正在為社會(huì)帶來(lái)深刻的變革。 在這場(chǎng)趨之若鶩的群體行動(dòng)中,面對(duì)這項(xiàng)持續(xù)發(fā)展變化的技術(shù)簇,我們應(yīng)采取一種積極探索與謹(jǐn)慎評(píng)估并重的策略——既要保持理性,也要保持樂(lè)觀,以此來(lái)應(yīng)對(duì)不確定性。技術(shù)的更新迭代需要時(shí)間與耐心,而技術(shù)的應(yīng)用則需了解其限制和準(zhǔn)確判斷業(yè)務(wù)場(chǎng)景。 要有效利用大模型,首先,必須明確他們的優(yōu)勢(shì)和不足(圖1)。接下來(lái),整理業(yè)務(wù)操作流程即業(yè)務(wù)SOP,確保對(duì)業(yè)務(wù)場(chǎng)景有深刻理解和準(zhǔn)確的認(rèn)知。其次,對(duì)領(lǐng)域知識(shí)進(jìn)行必要的梳理。第四,在搭建Agent的過(guò)程中,盡可能的規(guī)避LLM的局限(例如,通過(guò)多輪對(duì)話精準(zhǔn)捕捉識(shí)別用戶意圖)。第五,要做好企業(yè)內(nèi)專(zhuān)業(yè)資料的處理和必要工具的建設(shè)。最后,準(zhǔn)備好對(duì)Agent進(jìn)行持續(xù)的優(yōu)化(效果優(yōu)化),從而在應(yīng)用大型模型時(shí)發(fā)揮其優(yōu)勢(shì),規(guī)避弱點(diǎn)。 一、大模型原生能力&局限大模型擅長(zhǎng)語(yǔ)義理解、邏輯推理以及生成和創(chuàng)作內(nèi)容。然而,它們目前存在一些限制,包括對(duì)特定領(lǐng)域的深入理解和時(shí)效性不足、有限的記憶能力、在實(shí)際情況中的魯棒性不夠,導(dǎo)致錯(cuò)誤、潛在的安全風(fēng)險(xiǎn)、推理和規(guī)劃能力尚待提升、缺少合作意識(shí)而無(wú)法協(xié)同解決復(fù)雜問(wèn)題、以及缺乏視覺(jué)和聽(tīng)覺(jué)等感官能力,有時(shí)生成的信息可能不精確或是虛構(gòu)的。在構(gòu)建Agent時(shí),可以通過(guò)集成其他技術(shù)和能力來(lái)補(bǔ)充和改進(jìn)大模型的這些不足。 另外,一些限制更多地取決于大型模型自身能力的提升。例如,泛化能力和過(guò)度擬合現(xiàn)象,這可能導(dǎo)致對(duì)含糊不清的信息的理解出現(xiàn)歧義,或者混淆了特定領(lǐng)域的知識(shí)。模型處理上下文的能力也受到長(zhǎng)度的限制。模型的可解釋性和可調(diào)試性不足,使其在某些情況下表現(xiàn)得像一個(gè)局部的黑箱。由于模型參數(shù)眾多,推理過(guò)程耗時(shí)較長(zhǎng)。此外,微調(diào)模型對(duì)高性能的GPU和TPU計(jì)算資源的需求也相對(duì)較大。 二、Agent為讓大模型更充分的發(fā)揮價(jià)值,突破當(dāng)前的局限,主流趨勢(shì)是通過(guò)Agent增強(qiáng)能力(大腦),為大模型增加眼耳鼻口手腳的能力。 2.1 Agent框架Agent為大模型提供了執(zhí)行復(fù)雜任務(wù)、與環(huán)境交互、自主決策和長(zhǎng)期記憶等關(guān)鍵能力,使得大模型的應(yīng)用從單純的語(yǔ)言處理擴(kuò)展到更廣泛的領(lǐng)域,包括自動(dòng)化任務(wù)執(zhí)行、客戶服務(wù)、內(nèi)容創(chuàng)作等,極大地?cái)U(kuò)展了AI的實(shí)用性和影響力。為了實(shí)現(xiàn)這樣一套解決方案(圖2),背后需要用工程化的手段落地——工具鏈。 2.2 一站式AI Agent開(kāi)發(fā)工具鏈Agent開(kāi)發(fā)平臺(tái)是面向智能體生產(chǎn)場(chǎng)景的一站式開(kāi)發(fā)工具,具備智能體編排、流程搭建、知識(shí)庫(kù)管理、大小模型交互、計(jì)量、開(kāi)放、私有化部署等功能,能夠有效提升智能體研發(fā)效率,降低研發(fā)成本。目前國(guó)內(nèi)知名的Agent開(kāi)發(fā)平臺(tái)包括百度的千帆、阿里的百煉、字節(jié)的Coze、Dify以及騰訊的元器等。 2.3 工具鏈競(jìng)品分析1)字節(jié)Coze Coze平臺(tái)專(zhuān)為零代碼或低代碼(可視化編排)開(kāi)發(fā)者設(shè)計(jì),極大地降低了開(kāi)發(fā)門(mén)檻,使得非技術(shù)人員也能快速上手。 優(yōu)勢(shì):
但整體的動(dòng)線繁瑣,用好的門(mén)檻比較高。 2)騰訊元器 網(wǎng)站風(fēng)格一如既往的“節(jié)制”,功能布局清晰易懂,用戶無(wú)需花費(fèi)腦力去理解網(wǎng)站的結(jié)構(gòu)、布局和導(dǎo)航。該有的元素都有,后續(xù)在生態(tài)建設(shè)上,期待看到更多的可能,包括且不限于更豐富的大模型可選、插件…… 3)Dify 是做LLM應(yīng)用開(kāi)發(fā)平臺(tái)中最早的一批之一,且功能性甚至比國(guó)內(nèi)頭部大廠更突出,相比之下,目前它是是Github上Star數(shù)最多的大模型應(yīng)用開(kāi)發(fā)工具(54000星),是全球LLM Tools增速Top1的開(kāi)源項(xiàng)目(300萬(wàn)的安裝量)。 優(yōu)勢(shì):
4)百度千帆AppBuilder 千帆AppBuilder提供全面便捷的應(yīng)用開(kāi)發(fā)套件與資源環(huán)境,包括大模型驅(qū)動(dòng)的開(kāi)發(fā)組件(文字識(shí)別、文生圖等多模態(tài)能力),內(nèi)置RAG(檢索增強(qiáng)生成)、Agent(智能體)、GBI(智能數(shù)據(jù)分析)等常用的AI原生應(yīng)用框架,語(yǔ)音識(shí)別、TTS、文生圖等AI能力組件,以及各類(lèi)IAAS云資源。使得開(kāi)發(fā)者能夠在一個(gè)平臺(tái)上完成從應(yīng)用開(kāi)發(fā)到部署的全過(guò)程,大大提高了開(kāi)發(fā)效率。 優(yōu)勢(shì):
5)阿里百煉 優(yōu)勢(shì):
6)競(jìng)品分析:核心功能 從Agent構(gòu)建(編排)、節(jié)點(diǎn)(及節(jié)點(diǎn)管理)、生態(tài)、發(fā)布渠道、OPS,5個(gè)一級(jí)維度,70個(gè)三級(jí)維度,來(lái)評(píng)估5個(gè)頭部供應(yīng)商的功能,可以看出,在過(guò)去一年多的時(shí)間里,各家的開(kāi)發(fā)工具鏈都在快速演進(jìn)和迭代。 2.4 參與方以企業(yè)內(nèi)部自建or私有化部署Agent開(kāi)發(fā)平臺(tái)角度看,利益相關(guān)者有Agent開(kāi)發(fā)平臺(tái)的建造者(自建)or維護(hù)人(外采)。有小白用戶,有研發(fā)能力的Agent開(kāi)發(fā)者(包括插件的開(kāi)發(fā)、知識(shí)庫(kù)的建設(shè)等圍繞大模型應(yīng)用的一系列的元素建設(shè)),還有外部的三方服務(wù)商(提供底層基座大模型、Agent開(kāi)發(fā)套件、解決方案、甚至是上手幫企業(yè)調(diào)Agent)。 2.5 沉淀的AI資產(chǎn)——生態(tài)市場(chǎng)在大模型的范疇內(nèi),新型的AI資產(chǎn)是企業(yè)核心價(jià)值力的一種體現(xiàn)。包括各種Agent(Mult-Agent)、Flow工作流、業(yè)務(wù)的SOP、大&小模型、Prompt、插件、知識(shí)庫(kù)、知識(shí)圖譜、語(yǔ)料、評(píng)測(cè)集、評(píng)測(cè)排行榜(含報(bào)告)……。這些資產(chǎn)在具體的業(yè)務(wù)領(lǐng)域應(yīng)用中,像變形金剛一樣,可以單打獨(dú)斗,也可以組合變形,以解決文本編輯、圖像處理、語(yǔ)音識(shí)別、智能助手等形態(tài)推進(jìn)企業(yè)的產(chǎn)品創(chuàng)新、服務(wù)質(zhì)量的提升、運(yùn)營(yíng)效率的改進(jìn)、營(yíng)銷(xiāo)效果的高轉(zhuǎn)化。 三、Agent開(kāi)發(fā)生命周期上文介紹了Agent開(kāi)發(fā)工具,有了這些利器,接下來(lái)的關(guān)鍵點(diǎn)在于如何巧妙的運(yùn)用它們?構(gòu)建并完善Agent,以確保業(yè)務(wù)效率的顯著提升,是展現(xiàn)大模型價(jià)值的最佳途徑。企業(yè)內(nèi)部做Agent一般經(jīng)過(guò)3個(gè)步驟: 其一,業(yè)務(wù)提需求,搭建Agent,確保POC符合業(yè)務(wù)預(yù)期 其二,正式開(kāi)發(fā)Agent,以及對(duì)接業(yè)務(wù)系統(tǒng),上線交付 其三,持續(xù)運(yùn)營(yíng)優(yōu)化Agent,不斷提升效果 四、行業(yè)發(fā)展趨勢(shì)VS企業(yè)落地關(guān)鍵點(diǎn)在企業(yè)實(shí)際搭建Agent的過(guò)程中,有三個(gè)關(guān)鍵步驟極其重要,必須由企業(yè)內(nèi)部人員主動(dòng)參與并領(lǐng)導(dǎo),這是無(wú)法通過(guò)購(gòu)買(mǎi)第三方服務(wù)來(lái)取代的。 其一,是讓大型模型理解企業(yè)內(nèi)部的數(shù)據(jù)、信息和知識(shí),為Agent提供高質(zhì)量、精確的數(shù)據(jù)資源,以便讓大型模型輸出符合業(yè)務(wù)預(yù)期的答案是至關(guān)重要的。數(shù)據(jù)到信息,信息到知識(shí),知識(shí)到智慧的轉(zhuǎn)化過(guò)程,需要從最終使用者的角度反向思考。如何采集、處理和加工數(shù)據(jù)、信息、知識(shí)才能達(dá)到預(yù)期效果。這需要在六個(gè)方面進(jìn)行思考:準(zhǔn)確性、完整性、全面性、粒度(粗糙或詳細(xì))、關(guān)聯(lián)性以及訪問(wèn)或使用權(quán)限。信息處理的效果對(duì)于企業(yè)有效利用大型模型至關(guān)重要,這需要具備專(zhuān)業(yè)知識(shí)的人員掌握與大型模型互動(dòng)的專(zhuān)門(mén)技巧,如提示(Prompt)和知識(shí)庫(kù)或記憶技巧。 其二,通過(guò)使用插件,可以實(shí)現(xiàn)Agent與企業(yè)現(xiàn)有系統(tǒng)的無(wú)縫集成,從而提升系統(tǒng)的智能化程度。這一過(guò)程通常由開(kāi)發(fā)團(tuán)隊(duì)負(fù)責(zé)編碼(或使用如Cursor等代碼生成工具)。在此過(guò)程中,需要重視元數(shù)據(jù)的完整性(AI資產(chǎn)管理),以便實(shí)現(xiàn)最大程度的復(fù)用性,從而提高企業(yè)內(nèi)部系統(tǒng)對(duì)接的效率。 其三,在構(gòu)建Agent之前,我們需要理清業(yè)務(wù)的標(biāo)準(zhǔn)操作流程(SOP)。在編輯工作流時(shí),開(kāi)發(fā)者需要參照SOP,將大模型、知識(shí)庫(kù)、插件等原始元素進(jìn)行編排,并通過(guò)邏輯節(jié)點(diǎn)將流程連貫起來(lái),從而“虛擬重現(xiàn)”業(yè)務(wù)場(chǎng)景。這三個(gè)方面的推進(jìn)效率和質(zhì)量,決定了一個(gè)企業(yè)應(yīng)用大型模型的效率和效果,也決定了在這場(chǎng)生產(chǎn)力革命中的排位。 可以預(yù)見(jiàn),在2025年,大模型應(yīng)用將給我們帶來(lái)更多令人驚嘆的“哇哦”時(shí)刻,讓我們拭目以待~ 受作者領(lǐng)域認(rèn)知深度所限及技術(shù)無(wú)時(shí)無(wú)刻不在更新迭代,業(yè)界對(duì)LLM、AGI、Agent、GPT……的衍生應(yīng)用必定是珠零錦粲。無(wú)法在一篇中盡現(xiàn)全貌,未來(lái)可能會(huì)徹底推翻當(dāng)下的種種嘗試而不得知。能為大家?guī)ヒ稽c(diǎn)點(diǎn)新的啟發(fā),以深感欣慰。文中難免有紕漏或不準(zhǔn)確的地方,歡迎大家批評(píng)指正。 撰寫(xiě)中參考網(wǎng)絡(luò)上各位同仁的最新觀點(diǎn),拿來(lái)主義未打招呼,還望見(jiàn)諒。若有任何建議或意見(jiàn),歡迎聯(lián)系作者探討。 作者:shucay、佳琪 本文由@shucay 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載 該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。 |