請登錄后使用快捷導(dǎo)航
沒有賬號？立即注冊

快捷導(dǎo)航

D-Think | 東遠(yuǎn)科技-廣州東遠(yuǎn)智能科技有限公司- › 首頁 ›資訊› 科技頭條 › 查看內(nèi)容

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

2025-2-4 08:14| 發(fā)布者: admin| 查看: 112| 評論: 0

摘要: 夢晨西風(fēng) 發(fā)自凹非寺量子位 | 公眾號 QbitAI就在開源的DeepSeek-R1被整合進(jìn)各路AI搜索工具之際，OpenAI臨時舉行小型發(fā)布會。4點(diǎn)27通知，8點(diǎn)開始直播。ChatGPT上新“Deep Research”，把推理大模型的思考能力用于聯(lián) ...

夢晨西風(fēng) 發(fā)自凹非寺
量子位 | 公眾號 QbitAI

就在開源的DeepSeek-R1被整合進(jìn)各路AI搜索工具之際，OpenAI臨時舉行小型發(fā)布會。

4點(diǎn)27通知，8點(diǎn)開始直播。

ChatGPT上新“Deep Research”，把推理大模型的思考能力用于聯(lián)網(wǎng)搜索。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

據(jù)介紹，Deep Research功能可在數(shù)十分鐘完成人類專家需要幾個小時的復(fù)雜研究任務(wù)。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

在“人類最后的考試”上，Deep Research刷新了最高分，比o3-mini高推理設(shè)置分?jǐn)?shù)高出一倍。

該測試包括3000多個多選和簡答題，涵蓋從語言學(xué)、火箭科學(xué)到生態(tài)學(xué)的100多個主題。

與o1相比，Deep Research最突出的地方在化學(xué)，人文和社會科學(xué)以及數(shù)學(xué)中，表現(xiàn)出類似人類的“在必要時尋找專業(yè)信息”的能力。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

另一項(xiàng)測試GAIA，在現(xiàn)實(shí)世界問題上評估AI的公開基準(zhǔn)測試，Deep Research在3個級別的難度上均刷新記錄。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

出于保護(hù)基準(zhǔn)測試的目的，OpenAI只展示了Deep Research在完成這些任務(wù)時的搜索過程，隱去了最終答案。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

Deep Research功能接下來將對Pro、Plus和Team用戶開放。

奧特曼后面補(bǔ)充，目前版本基于o3構(gòu)建，Plus用戶（20美元/月）每個月能用約10次，且正在構(gòu)建一個更高效的版本。

此外，免費(fèi)用戶也能獲得非常少量的使用額度。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

推理Agent的第一步

OpenAI表示，Deep Research專門為在金融/科學(xué)/工程等領(lǐng)域從事高強(qiáng)度知識工作、需要深入精確且可靠研究的人群而設(shè)計(jì)。

它由OpenAI o3驅(qū)動，通過基于真實(shí)任務(wù)（涉及瀏覽器和Python工具的使用）的訓(xùn)練，采用了與o1相同的強(qiáng)化學(xué)習(xí)方法。

只需一個提示，它就會查找分析并整合數(shù)百個在線資源，生成一份達(dá)到研究分析師水平的綜合報(bào)告。

Deep Research對于OpenAI的重要性，官方原話是：

Deep Research標(biāo)志著我們在開發(fā)AGI的宏偉目標(biāo)上邁出了重要一步。我們長期以來一直設(shè)想AGI能夠進(jìn)行新穎的科學(xué)研究，而Deep Research正是這一愿景的重要進(jìn)展。

使用方法，點(diǎn)擊輸入框下方的Deep Research按鈕即可，支持上傳文件添加額外資料。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

例如prompt：

Compile a research report on how the retail industry has changed in the past 3 years. Use bullets and tables where necessary for clarity.（寫一份關(guān)于過去三年零售業(yè)變化的研究報(bào)告，并運(yùn)用項(xiàng)目符號和表格來提升內(nèi)容的清晰度）

ChatGPT線會確認(rèn)一下問題細(xì)節(jié)信息，比如“您能具體說明您最感興趣的零售業(yè)方面嗎？”“您需要全球視角還是特定地區(qū)的分析？”

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

然后，它就開始分析+挖掘信息了：

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

側(cè)邊欄會顯示所采取的步驟摘要和使用的信息來源。

完成任務(wù)的時間大概是5-30分鐘，最終結(jié)果將以報(bào)告的形式輸出。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

OpenAI表示，接下來幾周內(nèi)，還將為這些報(bào)告添加嵌入式圖片、數(shù)據(jù)可視化和其它分析輸出。

和GPT-4o等相比，Deep Research對于需要深度和細(xì)節(jié)的多方面、特定領(lǐng)域的問題，能夠進(jìn)行廣泛探索并引用每個觀點(diǎn)。

不過，OpenAI也指出了Deep Research存在的局限性。

它有時會在回復(fù)中產(chǎn)生事實(shí)幻覺或做出錯誤的推斷，盡管根據(jù)內(nèi)部評估，其錯誤率明顯低于現(xiàn)有的ChatGPT模型。
它可能在區(qū)分權(quán)威信息和謠言方面遇到困難，并且在自信度校準(zhǔn)方面目前表現(xiàn)出弱點(diǎn)，常常無法準(zhǔn)確傳達(dá)不確定性。
報(bào)告和引用中可能會有輕微的格式錯誤，并且啟動任務(wù)可能需要更長的時間。

下一步，OpenAI表示將在本月內(nèi)將Deep Research推到移動和桌面APP端。目前，Deep Research可以訪問公開網(wǎng)絡(luò)和上傳的文件，未來將能夠連接到更多專業(yè)化的數(shù)據(jù)源，使其輸出更加穩(wěn)健和個性化。

我們預(yù)見ChatGPT將實(shí)現(xiàn)Agent體驗(yàn)的融合，用于異步、現(xiàn)實(shí)世界的研發(fā)和執(zhí)行。Deep Research（可進(jìn)行異步在線調(diào)查）與Operator（可進(jìn)行現(xiàn)實(shí)行動）的結(jié)合，使ChatGPT能夠執(zhí)行越來越復(fù)雜的任務(wù)。

AI深度搜索是互聯(lián)網(wǎng)的新界面

OpenAI研究員Jason Wei分享了他對這項(xiàng)新研究的看法：

它不僅是出色的Agent，也可以看成是互聯(lián)網(wǎng)的新界面

人類使用互聯(lián)網(wǎng)需要大量時間來搜索和點(diǎn)擊，受到時間和注意力的限制。

AI永遠(yuǎn)不會累，一次可以瀏覽許多網(wǎng)站，并擁有幾乎無限的世界知識。

將來，通過瀏覽器手動瀏覽互聯(lián)網(wǎng)將過時，就像手動計(jì)算數(shù)字而不使用計(jì)算器一樣。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

OpenAI toG業(yè)務(wù)負(fù)責(zé)人Felipe Millon則分享了一個個人故事。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

10月底，Millon的妻子被診斷出患有雙側(cè)乳腺癌，病情很嚴(yán)重，在12月初做了雙乳房切除手術(shù)，晚些時候開始化療。

他們遇到一個新問題，是否應(yīng)該接受放療，對于她的具體病情來說，這是一個模糊問題，不同的專家給出不同的建議。

Millon在OpenAI已經(jīng)獲得了Deep Research的測試權(quán)限，就嘗試上傳了手術(shù)報(bào)告，并詢問ChatGPT的建議。

ChatGPT不僅證實(shí)了人類專家提到的內(nèi)容，還搜索出了全新的參考研究。

MIllon認(rèn)為，這是一個將改變世界的工具。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

此外也有少數(shù)第三方團(tuán)隊(duì)提前獲得了Deep Research的測試資格，并在今日分享測試結(jié)果。

Every團(tuán)隊(duì)介紹，一些問題要花費(fèi)30分鐘才得到結(jié)果，答案可能超過1萬個單詞。

OpenAI緊急加播：ChatGPT上新深度搜索，持續(xù)思考30分鐘輸出1萬字

他們做的測試包括：

撰寫從2020年到今天每一天的歷史
閱讀《戰(zhàn)爭與和平》的第1章，分析托爾斯泰的人物描寫，回答他對人性的看法是什么？
仔細(xì)查閱近期的 10-K 報(bào)告以發(fā)現(xiàn)未報(bào)告的財(cái)務(wù)違規(guī)行為
……

測試中發(fā)現(xiàn)的局限性包括：

有時信息缺失引用來源
沒有“停止”按鈕，如果搜索歪了只能重頭開始

直播回看：
https://www.youtube.com/watch?v=YkCDVn3_wiw

參考鏈接：
[1]https://openai.com/index/introducing-deep-research/
[2]https://x.com/_jasonwei/status/1886213911906504950
[3]https://x.com/danshipper/status/1886203397004783996

— 完 —

量子位 QbitAI · 頭條號簽約

關(guān)注我們，第一時間獲知前沿科技