就在開源的DeepSeek-R1被整合進(jìn)各路AI搜索工具之際,OpenAI臨時舉行小型發(fā)布會。 4點(diǎn)27通知,8點(diǎn)開始直播。 ChatGPT上新“Deep Research”,把推理大模型的思考能力用于聯(lián)網(wǎng)搜索。 據(jù)介紹,Deep Research功能可在數(shù)十分鐘完成人類專家需要幾個小時的復(fù)雜研究任務(wù)。 在“人類最后的考試”上,Deep Research刷新了最高分,比o3-mini高推理設(shè)置分?jǐn)?shù)高出一倍。 該測試包括3000多個多選和簡答題,涵蓋從語言學(xué)、火箭科學(xué)到生態(tài)學(xué)的100多個主題。 與o1相比,Deep Research最突出的地方在化學(xué),人文和社會科學(xué)以及數(shù)學(xué)中,表現(xiàn)出類似人類的“在必要時尋找專業(yè)信息”的能力。 另一項(xiàng)測試GAIA,在現(xiàn)實(shí)世界問題上評估AI的公開基準(zhǔn)測試,Deep Research在3個級別的難度上均刷新記錄。 出于保護(hù)基準(zhǔn)測試的目的,OpenAI只展示了Deep Research在完成這些任務(wù)時的搜索過程,隱去了最終答案。 Deep Research功能接下來將對Pro、Plus和Team用戶開放。 奧特曼后面補(bǔ)充,目前版本基于o3構(gòu)建,Plus用戶(20美元/月)每個月能用約10次,且正在構(gòu)建一個更高效的版本。 此外,免費(fèi)用戶也能獲得非常少量的使用額度。 推理Agent的第一步OpenAI表示,Deep Research專門為在金融/科學(xué)/工程等領(lǐng)域從事高強(qiáng)度知識工作、需要深入精確且可靠研究的人群而設(shè)計(jì)。 它由OpenAI o3驅(qū)動,通過基于真實(shí)任務(wù)(涉及瀏覽器和Python工具的使用)的訓(xùn)練,采用了與o1相同的強(qiáng)化學(xué)習(xí)方法。 只需一個提示,它就會查找分析并整合數(shù)百個在線資源,生成一份達(dá)到研究分析師水平的綜合報(bào)告。 Deep Research對于OpenAI的重要性,官方原話是:
使用方法,點(diǎn)擊輸入框下方的Deep Research按鈕即可,支持上傳文件添加額外資料。 例如prompt:
ChatGPT線會確認(rèn)一下問題細(xì)節(jié)信息,比如“您能具體說明您最感興趣的零售業(yè)方面嗎?”“您需要全球視角還是特定地區(qū)的分析?” 然后,它就開始分析+挖掘信息了: 側(cè)邊欄會顯示所采取的步驟摘要和使用的信息來源。 完成任務(wù)的時間大概是5-30分鐘,最終結(jié)果將以報(bào)告的形式輸出。 OpenAI表示,接下來幾周內(nèi),還將為這些報(bào)告添加嵌入式圖片、數(shù)據(jù)可視化和其它分析輸出。 和GPT-4o等相比,Deep Research對于需要深度和細(xì)節(jié)的多方面、特定領(lǐng)域的問題,能夠進(jìn)行廣泛探索并引用每個觀點(diǎn)。 不過,OpenAI也指出了Deep Research存在的局限性。
下一步,OpenAI表示將在本月內(nèi)將Deep Research推到移動和桌面APP端。目前,Deep Research可以訪問公開網(wǎng)絡(luò)和上傳的文件,未來將能夠連接到更多專業(yè)化的數(shù)據(jù)源,使其輸出更加穩(wěn)健和個性化。
AI深度搜索是互聯(lián)網(wǎng)的新界面OpenAI研究員Jason Wei分享了他對這項(xiàng)新研究的看法:
人類使用互聯(lián)網(wǎng)需要大量時間來搜索和點(diǎn)擊,受到時間和注意力的限制。 AI永遠(yuǎn)不會累,一次可以瀏覽許多網(wǎng)站,并擁有幾乎無限的世界知識。
OpenAI toG業(yè)務(wù)負(fù)責(zé)人Felipe Millon則分享了一個個人故事。 10月底,Millon的妻子被診斷出患有雙側(cè)乳腺癌,病情很嚴(yán)重,在12月初做了雙乳房切除手術(shù),晚些時候開始化療。 他們遇到一個新問題,是否應(yīng)該接受放療,對于她的具體病情來說,這是一個模糊問題,不同的專家給出不同的建議。 Millon在OpenAI已經(jīng)獲得了Deep Research的測試權(quán)限,就嘗試上傳了手術(shù)報(bào)告,并詢問ChatGPT的建議。 ChatGPT不僅證實(shí)了人類專家提到的內(nèi)容,還搜索出了全新的參考研究。 MIllon認(rèn)為,這是一個將改變世界的工具。 此外也有少數(shù)第三方團(tuán)隊(duì)提前獲得了Deep Research的測試資格,并在今日分享測試結(jié)果。 Every團(tuán)隊(duì)介紹,一些問題要花費(fèi)30分鐘才得到結(jié)果,答案可能超過1萬個單詞。 他們做的測試包括:
測試中發(fā)現(xiàn)的局限性包括:
直播回看: 參考鏈接: — 完 — 量子位 QbitAI · 頭條號簽約 關(guān)注我們,第一時間獲知前沿科技 |
19款電子扎帶
電路板識別電子標(biāo)簽