在 Snowflake Build 2024 的主題演講中,吳恩達(dá)深入探討了智能體的興起及其背后推動(dòng)的 AI 革命。 他指出,非結(jié)構(gòu)化數(shù)據(jù)(如文本、圖像、視頻和音頻)正變得比以往任何時(shí)候都更加關(guān)鍵,為企業(yè)帶來了巨大的機(jī)會(huì)。 此外,吳恩達(dá)還分享了如何通過智能體和生成式 AI 的結(jié)合,以更快的速度構(gòu)建和迭代新的 AI 應(yīng)用,以下為這次演講的主要內(nèi)容: 你可能聽過我說過,AI 是新的電力。這是因?yàn)?AI 像電力一樣,是一種通用技術(shù)。如果有人問電力的用途是什么,這很難回答,因?yàn)殡娏缀鯚o所不能。 而如今的新 AI 技術(shù)正在為我們創(chuàng)造一個(gè)前所未有的機(jī)會(huì),能夠構(gòu)建以前無法實(shí)現(xiàn)的新應(yīng)用。 人們經(jīng)常問我:“Andrew,AI 領(lǐng)域最大的機(jī)會(huì)在哪里?”我通常會(huì)以“AI 堆?!眮斫忉尅T诙褩5淖畹讓邮前雽?dǎo)體,然后是云計(jì)算和開發(fā)工具(包括 Snowflake 這樣的工具)。 在這些之上是許多基礎(chǔ)模型以及模型的訓(xùn)練過程。而事實(shí)是,很多媒體的關(guān)注點(diǎn)都集中在這些技術(shù)層面,例如生成式 AI 和新的技術(shù)進(jìn)展上。 這些確實(shí)重要,但實(shí)際上還有另一層更重要的堆棧——應(yīng)用層。因?yàn)槲覀冃枰ㄟ^應(yīng)用層來產(chǎn)生更多的價(jià)值和收入,從而能夠支持底層技術(shù)的持續(xù)發(fā)展。 因此,我花了大量時(shí)間思考 AI 應(yīng)用領(lǐng)域,我認(rèn)為這是構(gòu)建新事物的最佳機(jī)會(huì)之一。 過去幾年,尤其是在生成式 AI 的推動(dòng)下,我們見證了機(jī)器學(xué)習(xí)模型開發(fā)的速度越來越快。 例如,構(gòu)建一個(gè)情感分類器的傳統(tǒng)方法可能需要一個(gè)月來收集標(biāo)簽數(shù)據(jù),再花幾個(gè)月訓(xùn)練 AI 模型,然后再用幾個(gè)月部署在云服務(wù)上。 對(duì)于許多價(jià)值巨大的 AI 系統(tǒng)來說,這樣的開發(fā)流程需要 6 到 12 個(gè)月。但有了生成式 AI,某些應(yīng)用場(chǎng)景只需花幾天寫一個(gè) prompt(提示詞),再用幾天時(shí)間完成部署。 這意味著,原本需要幾個(gè)月甚至一年的開發(fā)時(shí)間,現(xiàn)在可能只需要 10 天左右。這種變化為快速試驗(yàn)和開發(fā)新原型以及快速發(fā)布新 AI 產(chǎn)品創(chuàng)造了巨大可能。 這一趨勢(shì)的結(jié)果是,快速實(shí)驗(yàn)成為發(fā)明新用戶體驗(yàn)的一種更有效途徑。過去,如果需要花 6 個(gè)月開發(fā)一個(gè)東西,我們會(huì)非常謹(jǐn)慎地研究用戶需求、制定產(chǎn)品計(jì)劃,再投入大量精力來開發(fā)。 但現(xiàn)在,快速推進(jìn)的團(tuán)隊(duì)可以說:“我們用一個(gè)周末開發(fā) 20 個(gè)原型,看看哪個(gè)有前景。如果 18 個(gè)失敗了,我們就放棄它們,只保留成功的兩個(gè)?!笨焖俚蛯?shí)驗(yàn)成為了一種新的發(fā)明路徑。 然而,這種快速實(shí)驗(yàn)帶來了新的瓶頸——評(píng)估(Evaluation)。在傳統(tǒng)的監(jiān)督學(xué)習(xí)中,如果你需要收集 1 萬(wàn)條數(shù)據(jù)點(diǎn)來訓(xùn)練模型,那么多收集 1 千條測(cè)試數(shù)據(jù)點(diǎn)也不算什么,因?yàn)槌杀緝H增加了 10%。 但在基于大型語(yǔ)言模型的應(yīng)用中,如果不需要標(biāo)注數(shù)據(jù),那么收集 1 千條測(cè)試樣本的成本和時(shí)間可能顯得非常昂貴。 因此,現(xiàn)在的開發(fā)流程更像是邊開發(fā)邊收集數(shù)據(jù),而不是先收集數(shù)據(jù)再開發(fā)。我們會(huì)先構(gòu)建一個(gè)原型,然后隨著需求的增加逐步完善測(cè)試數(shù)據(jù),以提高系統(tǒng)的穩(wěn)健性和可靠性。 雖然模型原型的構(gòu)建速度快了,但軟件應(yīng)用的開發(fā)依然包含很多步驟,比如產(chǎn)品設(shè)計(jì)、軟件集成、部署后的運(yùn)維等。 這些步驟并沒有像機(jī)器學(xué)習(xí)建模那樣大幅提速。這種不均衡的進(jìn)展對(duì)組織產(chǎn)生了壓力,迫使他們加快整個(gè)流程的速度。 在快速發(fā)展的環(huán)境中,我不認(rèn)為“快速行動(dòng)且破壞”是適合的口號(hào),因?yàn)檫@種方法的確會(huì)破壞很多東西。我更喜歡“快速行動(dòng)且負(fù)責(zé)任”這個(gè)理念。 我看到很多團(tuán)隊(duì)能夠快速開發(fā)原型,并進(jìn)行穩(wěn)健的測(cè)試,而不將可能造成傷害的產(chǎn)品直接發(fā)布到用戶手中。這種方法能夠在快速推進(jìn)的同時(shí),做到負(fù)責(zé)任地開發(fā)和部署。 在技術(shù)趨勢(shì)中,我最興奮的一個(gè)是 智能體 AI(Agentic AI)。這種工作流程不僅可以生成文本,還可以結(jié)合研究、規(guī)劃、修改等步驟,進(jìn)行迭代式開發(fā)。 例如,用傳統(tǒng)的大型語(yǔ)言模型生成一篇文章可能一次性完成,但智能體 AI 可以先生成提綱,進(jìn)行研究,編寫草稿,隨后再修訂和優(yōu)化。 這種迭代式流程適用于復(fù)雜任務(wù),比如法律文檔處理、醫(yī)療診斷輔助或合規(guī)文書管理。 智能體 AI 的四大設(shè)計(jì)模式包括: 反思(Reflection):讓 AI 審視自己的輸出并改進(jìn)。 工具調(diào)用(Tool Use):大語(yǔ)言模型可以發(fā)起 API 請(qǐng)求,執(zhí)行具體任務(wù)。 規(guī)劃(Planning):AI 為復(fù)雜任務(wù)設(shè)計(jì)執(zhí)行計(jì)劃。 多智能體協(xié)作(Multi-Agent Collaboration):多個(gè) AI 角色分工協(xié)作,共同完成任務(wù)。 這些模式讓我們能夠構(gòu)建比以往更加復(fù)雜和強(qiáng)大的系統(tǒng)。 另外,視覺 AI 正在崛起。過去很難從存儲(chǔ)的圖像和視頻數(shù)據(jù)中獲取價(jià)值,而如今,視覺 AI 的能力正在改變這一現(xiàn)狀。 通過結(jié)合智能體工作流程,視覺 AI 能夠高效處理和分析圖像與視頻數(shù)據(jù),為企業(yè)帶來新的價(jià)值。 例如,自動(dòng)檢測(cè)足球比賽中的進(jìn)球片段、生成視頻的元數(shù)據(jù)等,這些任務(wù)以前幾乎是不可能實(shí)現(xiàn)的。 最后,我想強(qiáng)調(diào)四大 AI 趨勢(shì): 1)加速的生成式工作流:通過硬件和軟件優(yōu)化,讓智能體 AI 運(yùn)行更高效; 2)為工具優(yōu)化的大模型:新的大模型不僅可以回答問題,還可以執(zhí)行具體操作; 3)非結(jié)構(gòu)化數(shù)據(jù)工程的重要性提升:文本、圖像和視頻數(shù)據(jù)的處理能力變得至關(guān)重要; 4)圖像處理革命即將到來:圖像處理技術(shù)的發(fā)展將為更多企業(yè)帶來新的應(yīng)用機(jī)會(huì); 本文由人人都是產(chǎn)品經(jīng)理作者【江天 Tim】,微信公眾號(hào):【有新Newin】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。 題圖來自Unsplash,基于 CC0 協(xié)議。 |