Anthropic創(chuàng)始人眼中的AI智能體進(jìn)化：工具、上下文、代碼與安全

2025-1-20 07:43| 發(fā)布者: admin| 查看: 87| 評(píng)論: 0

摘要: （來(lái)源：MIT Technology Review）AI 智能體目前是科技領(lǐng)域的熱門話題。從 Google DeepMind、OpenAI 到 Anthropic，各大頂尖公司正競(jìng)相為 LLM 賦予自主完成任務(wù)的能力。這類系統(tǒng)在行業(yè)內(nèi)被稱為 Agentic AI（代理式人 ...

（來(lái)源：MIT Technology Review）

AI 智能體目前是科技領(lǐng)域的熱門話題。從 Google DeepMind、OpenAI 到 Anthropic，各大頂尖公司正競(jìng)相為 LLM 賦予自主完成任務(wù)的能力。這類系統(tǒng)在行業(yè)內(nèi)被稱為 Agentic AI（代理式人工智能），是硅谷新的熱議焦點(diǎn)。從英偉達(dá)到 Salesforce，各家公司都在探討如何利用這項(xiàng)技術(shù)顛覆行業(yè)格局。

Sam Altman 在上周的一篇博客文章中表示：“我們相信，2025 年第一批 AI 智能體可能會(huì)加入職場(chǎng)，并實(shí)質(zhì)性地改變企業(yè)的產(chǎn)出。”

廣義上看，AI 智能體是一種能夠自主執(zhí)行任務(wù)的軟件系統(tǒng)，通常只需極少甚至完全不需要監(jiān)督。任務(wù)的復(fù)雜程度越高，智能體所需的智能水平也越高。對(duì)于許多人來(lái)說(shuō)，如今的 LLM 已經(jīng)足夠智能，可以驅(qū)動(dòng)智能體完成一系列實(shí)用任務(wù)，例如填寫表格、查找食譜并將所需食材添加到線上購(gòu)物車，或者在會(huì)議前通過(guò)搜索引擎快速完成最后的研究并生成簡(jiǎn)明的要點(diǎn)總結(jié)。

2023 年 10 月，Anthropic 展示了一款先進(jìn)的 AI 智能體：Claude 的一項(xiàng)擴(kuò)展功能“Computer Use”。顧名思義，這項(xiàng)功能使用戶能夠像指揮人類一樣指導(dǎo) Claude 操作電腦，包括移動(dòng)光標(biāo)、點(diǎn)擊按鈕和輸入文本。用戶不僅可以與 Claude 對(duì)話，還可以要求它直接在屏幕上完成任務(wù)。

Anthropic 指出，這項(xiàng)功能目前仍然存在繁冗和容易出錯(cuò)等問題，但已向一小部分測(cè)試人員開放，包括來(lái)自 DoorDash、Canva 和 Asana 等公司的第三方開發(fā)者。

這個(gè)項(xiàng)目展現(xiàn)了 AI 智能體未來(lái)發(fā)展的一個(gè)縮影。為進(jìn)一步探討趨勢(shì)，MIT Technology Review 采訪了 Anthropic 的聯(lián)合創(chuàng)始人兼首席科學(xué)家 Jared Kaplan，他分享了 AI 智能體在 2025 年可能發(fā)展的四個(gè)方向。

（Kaplan 的回答經(jīng)過(guò)輕微編輯以適應(yīng)篇幅和提升表述的清晰度。）

Anthropic創(chuàng)始人眼中的AI智能體進(jìn)化：工具、上下文、代碼與安全

更擅長(zhǎng)使用工具

“我認(rèn)為可以從兩個(gè)維度來(lái)理解 AI 的能力。一方面是 AI 系統(tǒng)能夠完成任務(wù)的復(fù)雜程度。隨著系統(tǒng)變得越來(lái)越智能，其在這一方面的能力不斷提升，而另一個(gè)關(guān)鍵維度是 AI 可以使用的環(huán)境或工具類型。”Kaplan 表示。

“舉個(gè)例子，如果我們回顧近10年前 DeepMind 的圍棋模型 AlphaGo，它已經(jīng)在下棋方面超越了人類。然而，如果 AI 的能力僅限于棋盤游戲，它的應(yīng)用環(huán)境就非常受限。即使擁有極高的智能，這種 AI 在現(xiàn)實(shí)中沒有實(shí)際用途。隨著文本模型、多模態(tài)模型的進(jìn)步，以及像‘Computer Use’這樣的功能（甚至未來(lái)可能涉及的機(jī)器人技術(shù)），AI 正逐步融入多樣化的環(huán)境和任務(wù)中，從而變得更加實(shí)用?！彼^續(xù)說(shuō)道。

“我們對(duì)‘Computer Use’感到興奮的原因也在于此。直到最近，大語(yǔ)言模型還必須依賴特定提示或工具，且局限于特定環(huán)境。而我認(rèn)為‘Computer Use’將快速提升模型在完成不同任務(wù)及更復(fù)雜任務(wù)方面的能力。此外，AI 也將逐漸學(xué)會(huì)識(shí)別自己的錯(cuò)誤，并在面對(duì)高風(fēng)險(xiǎn)問題時(shí)意識(shí)到需要尋求用戶的反饋?！彼赋?。

Anthropic創(chuàng)始人眼中的AI智能體進(jìn)化：工具、上下文、代碼與安全

更懂得理解上下文

Claude 需要對(duì)你的具體情況和你所處的約束條件有足夠的了解，才能真正對(duì)你發(fā)揮作用。這包括你的具體角色是什么、你的寫作風(fēng)格如何，以及你和你的組織的需求是什么。

“我認(rèn)為我們會(huì)在這方面看到顯著改進(jìn)，Claude 將能夠從你的文檔、Slack 等內(nèi)容中搜索和學(xué)習(xí)，從而真正理解對(duì)你有用的東西。這一點(diǎn)在智能體的討論中往往被低估了。一個(gè)系統(tǒng)不僅要有用，還需要安全，能夠準(zhǔn)確完成你期望的任務(wù)，這是非常重要的。”Kaplan 表示。

此外，許多任務(wù)實(shí)際上并不需要 Claude 進(jìn)行太多推理。比如，在打開 Google Docs 之前不需要進(jìn)行長(zhǎng)時(shí)間的深思熟慮?！耙虼耍艺J(rèn)為未來(lái)的發(fā)展方向不僅在于讓智能體擁有更多的推理能力，更在于確保它在真正需要時(shí)發(fā)揮推理作用，同時(shí)在不必要的時(shí)候避免浪費(fèi)時(shí)間。”他說(shuō)道。

Anthropic創(chuàng)始人眼中的AI智能體進(jìn)化：工具、上下文、代碼與安全

提升代碼助手的能力

“我們希望在‘Computer Use’功能還處于初期階段時(shí)，向開發(fā)者提供一個(gè)測(cè)試版，以便收集反饋。隨著這些系統(tǒng)的不斷完善，它們可能會(huì)被更廣泛地采用，并真正與用戶協(xié)作完成各種任務(wù)?！彼硎?。

像是 DoorDash、Browser Company 和 Canva 這樣的公司，正在嘗試不同類型的瀏覽器交互，同時(shí)借助 AI 設(shè)計(jì)這些交互方式。

“我預(yù)計(jì)代碼助手將進(jìn)一步改進(jìn)，這是一個(gè)對(duì)開發(fā)者來(lái)說(shuō)非常令人興奮的領(lǐng)域。如今，使用 Claude 3.5 進(jìn)行編程已經(jīng)引起了極大的興趣。它不再僅僅是提供自動(dòng)補(bǔ)全功能，而是能夠真正理解代碼中的問題，調(diào)試代碼，通過(guò)運(yùn)行代碼觀察其行為，并進(jìn)行修復(fù)?！彼硎?。

Anthropic創(chuàng)始人眼中的AI智能體進(jìn)化：工具、上下文、代碼與安全

需要被設(shè)計(jì)得更安全

“我們創(chuàng)立 Anthropic 的初衷，是因?yàn)轭A(yù)見到 AI 技術(shù)的快速發(fā)展，并意識(shí)到安全問題必然會(huì)變得更加重要。我認(rèn)為今年這些問題將更加直觀且緊迫，因?yàn)?AI 智能體將越來(lái)越多地融入我們的工作中，我們需要為各種潛在挑戰(zhàn)做好準(zhǔn)備，例如提示詞注入?！盞aplan 表示。

提示詞注入是一種攻擊方式，通過(guò)向大語(yǔ)言模型提供開發(fā)者未預(yù)見或未打算處理的惡意提示進(jìn)行攻擊。例如，可以將惡意提示嵌入模型可能訪問的網(wǎng)站中，以此實(shí)施攻擊。

“提示詞注入可能是我們?cè)?AI 智能體廣泛使用中需要優(yōu)先思考的關(guān)鍵問題之一，尤其對(duì)于‘Computer Use’功能而言，這個(gè)問題尤為重要?！拔覀冋诜e極應(yīng)對(duì)這一挑戰(zhàn)，因?yàn)槿绻瓹omputer Use’被大規(guī)模部署，可能會(huì)出現(xiàn)惡意網(wǎng)站或其他手段試圖誘導(dǎo) Claude 執(zhí)行不當(dāng)操作?！彼硎尽?/span>

“此外，隨著更高級(jí)模型的問世，相關(guān)風(fēng)險(xiǎn)也會(huì)增加。我們制定了穩(wěn)健的擴(kuò)展策略，確保隨著 AI 系統(tǒng)能力的提升，能夠有效防止其被濫用。例如，避免它被用于協(xié)助恐怖分子等不當(dāng)目的。”他繼續(xù)說(shuō)道。

“盡管如此，我對(duì) AI 的實(shí)際應(yīng)用仍充滿期待，畢竟它確實(shí)在內(nèi)部提升了我們的工作效率。Anthropic 團(tuán)隊(duì)以多種方式使用 Claude，特別是在編程領(lǐng)域，效果尤為顯著。然而，不可否認(rèn)，挑戰(zhàn)同樣不容忽視。今年無(wú)疑將是充滿變化和新機(jī)會(huì)的一年?！盞aplan 表示。

原文鏈接：

https://www.technologyreview.com/2025/01/11/1109909/anthropics-chief-scientist-on-5-ways-agents-will-be-even-better-in-2025/