請(qǐng) 登錄后使用快捷導(dǎo)航
沒(méi)有賬號(hào)？立即注冊(cè)

快捷導(dǎo)航

D-Think | 東遠(yuǎn)科技-廣州東遠(yuǎn)智能科技有限公司- › 首頁(yè) ›資訊› 科技頭條 › 查看內(nèi)容

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

2024-12-6 12:35| 發(fā)布者: admin| 查看: 106| 評(píng)論: 0

摘要: 機(jī)器之心報(bào)道機(jī)器之心編輯部一天前，OpenAI 官方 X 賬戶的一條推文將 AI 社區(qū)的期待值拉滿了。這家世界頭部 AI 公司宣布將在未來(lái)的 12 天進(jìn)行 12 場(chǎng)直播，發(fā)布一些「大大小小的新東西」。這是 OpenAI 準(zhǔn)備的圣誕禮物 ...

機(jī)器之心報(bào)道

機(jī)器之心編輯部

一天前，OpenAI 官方 X 賬戶的一條推文將 AI 社區(qū)的期待值拉滿了。這家世界頭部 AI 公司宣布將在未來(lái)的 12 天進(jìn)行 12 場(chǎng)直播，發(fā)布一些「大大小小的新東西」。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

這是 OpenAI 準(zhǔn)備的圣誕禮物。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

至于這些「大大小小的新東西」究竟是什么，各路網(wǎng)友都紛紛給出了自己的預(yù)測(cè)，大致總結(jié)一下主題包括 Sora、完全體 o1、更長(zhǎng)的記憶能力、實(shí)時(shí)視覺(jué)能力、Canvas 集成、高級(jí)語(yǔ)音模式、Computer Use、智能體甚至 AI 硬件設(shè)備等。但究竟如何，還得等著 OpenAI 自己來(lái)揭示。

現(xiàn)在，OpenAI 的第一場(chǎng)直播來(lái)了！

總結(jié)來(lái)說(shuō)，兩件事：期待已久的 o1 完全體（Full Version）、200 刀一個(gè)月的 ChatGPT Pro。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

OpenAI 著名研究科學(xué)家 Noam Brown 發(fā)帖表示，o1 完全體不僅能數(shù)出「strawberry」里有幾個(gè)「r」（此前的模型經(jīng)常在這一問(wèn)題上栽跟頭），還能更進(jìn)一步，寫出「一篇不使用字母『e』的關(guān)于草莓的三段短文」（GPT-4o 也嘗試了這個(gè)任務(wù)，但第一個(gè)詞就失敗了）。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

整場(chǎng)直播時(shí)間很短，大概 15 分鐘，參與者包括 CEO Sam Altman、研究科學(xué)家 Hyung Won Chung 和 Max 以及思維鏈提出者 Jason Wei。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

視頻：https://www.youtube.com/watch?v=iBfQTnA2n2s

o1 完全體

在今年 9 月份，OpenAI 發(fā)布 o1-preview 版本時(shí)，就曾對(duì) o1 的技術(shù)思路進(jìn)行了介紹：o1 是使用大規(guī)模強(qiáng)化學(xué)習(xí)訓(xùn)練并使用思維鏈進(jìn)行推理的系列模型。

今天正式發(fā)布了 o1 完全體，也放出了新的 o1 System Card：https://cdn.openai.com/o1-system-card-20241205.pdf

整體而言，o1 完全體是一款更擅長(zhǎng)編程、數(shù)學(xué)和寫作的更快且更強(qiáng)大的推理模型，并且現(xiàn)在也增加了對(duì)圖像上傳的支持，這讓 o1 可以使用視覺(jué)數(shù)據(jù)來(lái)生成更詳細(xì)和更有用的響應(yīng)。

OpenAI 表示，OpenAI o1 的思維更加簡(jiǎn)潔，因此響應(yīng)時(shí)間比 o1-preview 更快。測(cè)試表明，o1 的性能也優(yōu)于 o1-preview，將困難的現(xiàn)實(shí)問(wèn)題的重大錯(cuò)誤減少了 34%。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

除了完全體 o1，還有個(gè)更輕便的 o1-mini 版本，在編碼方面特別高效。

如果你愿意花更多錢，升級(jí)到 ChatGPT Pro，還可以體驗(yàn)到 o1 pro 模式。這是 o1 的一個(gè)更高級(jí)版本，使用更多的計(jì)算進(jìn)行更深入地思考，解答更難的問(wèn)題。

與 o1 和 o1-preview 相比，o1 pro 模式在數(shù)學(xué)、科學(xué)和編碼等 ML 基準(zhǔn)測(cè)試中表現(xiàn)更佳。OpenAI 發(fā)言人表示：「在外部專家測(cè)試人員的評(píng)估中，o1 pro 產(chǎn)生了更可靠、更準(zhǔn)確、更全面的回應(yīng)，尤其是在數(shù)據(jù)科學(xué)、編程和判例法分析等領(lǐng)域。與 o1 和 o1-preview 相比，o1 pro 模式在數(shù)學(xué)、科學(xué)和編碼方面具有挑戰(zhàn)性的機(jī)器學(xué)習(xí)基準(zhǔn)測(cè)試中表現(xiàn)更好。特別是，我們發(fā)現(xiàn)在更容易反映日常編程查詢的編碼競(jìng)賽題中，錯(cuò)誤率降低了 75%?！?/span>

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

為了突出 o1 pro 模式的主要優(yōu)勢(shì)（提高可靠性），OpenAI 使用更嚴(yán)格的評(píng)估設(shè)置：只有當(dāng)模型在四次嘗試中有四次能夠正確回答問(wèn)題（4/4 可靠性），而不是一次，才被認(rèn)為解決了問(wèn)題。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

正在嘗鮮的用戶們也在陸陸續(xù)續(xù)發(fā)掘出有關(guān) o1 的更多技術(shù)細(xì)節(jié)，比如所支持的最大 token 數(shù)量為 196608。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

具體效果如何？

直播中，OpenAI 進(jìn)行了演示。

首先，OpenAI 通過(guò)一個(gè)基于人工鳥巢圖像生成安裝手冊(cè)的示例演示了 o1 基于視覺(jué)數(shù)據(jù)進(jìn)行推理的能力：

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

識(shí)別手繪圖像也問(wèn)題不大。對(duì)于一張手繪的太空太陽(yáng)能驅(qū)動(dòng)的數(shù)據(jù)中心示意圖，o1 輕松估計(jì)出了其散熱器表面積并解答了兩個(gè)問(wèn)題：如何處理太陽(yáng)和深空環(huán)境，以及這里如何體現(xiàn)了熱力學(xué)第一定律？并且整個(gè)推理過(guò)程僅需 10 秒鐘。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

推理速度方面，在解答「列出二世紀(jì)的羅馬皇帝的在位時(shí)間和成就」的任務(wù)中，o1 完全體的推理時(shí)間大概為 14 秒，而 o1-preview 大概需要 33 秒。并且 Altman 表示實(shí)際部署之后的速度還會(huì)更快。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

那么，o1 處理更復(fù)雜問(wèn)題的表現(xiàn)如何呢，比如能否基于多條描述推斷出所描述的蛋白質(zhì)種類？（注意這個(gè)問(wèn)題之前的 o1-preview 無(wú)法正確解答。）

最終，在 pro mode 下，o1 完全體在思考了 53 秒之后得到了正確答案，并且還可以在 canvas 中了解更多細(xì)節(jié)。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

相當(dāng)昂貴的 ChatGPT Pro

OpenAI 宣布為其人工智能聊天機(jī)器人平臺(tái) ChatGPT 推出新的訂閱套餐 ——ChatGPT Pro，可以無(wú)限制地訪問(wèn) OpenAI 的所有模型，包括其 o1「推理」模型的完整版本，但價(jià)格非常昂貴 —— 每月 200 美元。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

OpenAI 技術(shù)人員 Jason Wei 表示：「我們認(rèn)為 ChatGPT Pro 的受眾將是 ChatGPT 的高級(jí)用戶，他們已經(jīng)在數(shù)學(xué)、編程和寫作等任務(wù)上將模型的能力推向極限?！?/span>

與大多數(shù) AI 不同，o1 和其他推理模型可以有效地進(jìn)行自我事實(shí)檢查。這有助于它們避免一些通常會(huì)使模型出錯(cuò)的陷阱，但缺點(diǎn)是通常需要更長(zhǎng)的時(shí)間才能找到解決方案。o1 通過(guò)任務(wù)進(jìn)行推理、提前規(guī)劃并執(zhí)行一系列行動(dòng)來(lái)幫助模型梳理出答案。

OpenAI 在 9 月份發(fā)布了 o1-preview，現(xiàn)在新版本 o1 的功能更加強(qiáng)大。

訪問(wèn) o1 不需要訂閱 ChatGPT Pro 套餐。所有 ChatGPT 付費(fèi)用戶都可以通過(guò) ChatGPT 模型選擇器工具訪問(wèn) o1。OpenAI 表示，計(jì)劃在未來(lái)幾個(gè)月內(nèi)增加對(duì)網(wǎng)頁(yè)瀏覽、文件上傳等功能的支持。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro

當(dāng)然，升級(jí)到 ChatGPT Pro，還可以體驗(yàn)到 o1 pro 模式。o1 pro 模式將「使用更多的計(jì)算來(lái)為最困難的問(wèn)題提供最佳答案」。

ChatGPT Pro 用戶可以通過(guò)在模型選擇器中選擇「o1 pro 模式」并直接提問(wèn)來(lái)訪問(wèn)該功能。由于生成答案需要更長(zhǎng)的時(shí)間，如果切換到另一個(gè)對(duì)話，ChatGPT 將顯示進(jìn)度條并發(fā)送應(yīng)用內(nèi)通知。

o1 pro 模式可能只是延長(zhǎng)了模型在給出答案之前的「推理」時(shí)間。OpenAI 在其 o1 預(yù)覽版公告中表示，它的目標(biāo)是試驗(yàn)推理時(shí)間長(zhǎng)達(dá)數(shù)小時(shí)、數(shù)天甚至數(shù)周的 o1 模型，以進(jìn)一步提高其推理能力，而這很可能是朝這個(gè)方向邁出的一步。

OpenAI 還宣布了一項(xiàng)捐贈(zèng)計(jì)劃，向知名機(jī)構(gòu)的醫(yī)學(xué)研究人員贈(zèng)送 10 套 ChatGPT Pro。該公司表示，他們未來(lái)還計(jì)劃在「各個(gè)學(xué)科」提供更多捐贈(zèng)。

為了增加吸引力，ChatGPT Pro 還包括無(wú)限制訪問(wèn) GPT-4o 和高級(jí)語(yǔ)音模式（ChatGPT 的人機(jī)對(duì)話功能）。ChatGPT Plus 用戶有每日使用時(shí)間限制，而免費(fèi)用戶僅限于預(yù)覽。

然而，ChatGPT Pro 是 OpenAI 目前最昂貴的訂閱服務(wù)，是 ChatGPT Plus 的 10 倍?？紤]到許多用戶已經(jīng)認(rèn)為 ChatGPT Plus 太貴，ChatGPT Pro 可能很難賣出去。

實(shí)際上，高級(jí) ChatGPT 的漲價(jià)傳聞?dòng)蓙?lái)已久。據(jù)《紐約時(shí)報(bào)》報(bào)道，到 2029 年，OpenAI 預(yù)計(jì) ChatGPT Plus 的月收費(fèi)將達(dá)到 44 美元。根據(jù) The Information 的報(bào)道，該公司還萌生了超高價(jià)商業(yè)訂閱的想法，這些訂閱可提供額外的功能，并可訪問(wèn)正在開發(fā)的模型。

現(xiàn)在看來(lái)，這些傳聞基本屬實(shí)。

這些舉措反映出投資者對(duì) OpenAI 縮小虧損的壓力。據(jù)《紐約時(shí)報(bào)》報(bào)道，雖然該公司 8 月份的月收入達(dá)到了 3 億美元，但 OpenAI 預(yù)計(jì)今年將虧損約 50 億美元。人員、辦公室租金和 AI 訓(xùn)練基礎(chǔ)設(shè)施等開支都是虧損的根源。據(jù)報(bào)道，僅 ChatGPT 一項(xiàng)就一度讓 OpenAI 每天損失 70 萬(wàn)美元。

OpenAI 的第一天直播最終在一個(gè)與圣誕相關(guān)的笑話中結(jié)束：

圣誕老人希望使用 LLM 來(lái)解決數(shù)學(xué)問(wèn)題，他努力使用了很多提示詞，但效果都不好，那么他最終怎么解決了這個(gè)問(wèn)題呢？

答案是他使用了 reindeer forcement learning。

OpenAI 12連更第一彈：o1完全體，200刀一個(gè)月的ChatGPT Pro