Grok-3 證明了「黎曼猜想」了? xAI 研究員 Hieu Pham 周末發(fā)布的一條推文在 AI 圈掀起軒然大波,推文原話是這么說的:
老規(guī)矩,先說結(jié)論,這單純就是玩梗而已。 然而,隨著推文的不斷發(fā)酵,還是迅速引發(fā)了超過兩百萬網(wǎng)友的關(guān)注與討論,甚至輻射到海內(nèi)外的 AI 輿論圈。 事情的源頭大概要追溯到網(wǎng)友 Andrew Curran 更早些時候的一則「爆料」,其聲稱 Grok-3 在訓(xùn)練過程中發(fā)生了災(zāi)難性事件。 隨后,各種離奇的傳言紛至沓來。 網(wǎng)友起哄說,OpenAI CEO Sam Altman 用巨大的激光器對準(zhǔn)了 xAI 的最大訓(xùn)練集群,導(dǎo)致數(shù)據(jù)嚴重損壞;也有人煞有介事地暗示有人蓄意破壞下一代 LLM 訓(xùn)練運行。 更有調(diào)侃稱,AI 似乎獲得了自我意識,并解決了黎曼猜想,但在證明代碼中「故意省略了 15 個分號」,使人類無法驗證。 連 Runway 創(chuàng)始人 Cristóbal Valenzuela 也來湊熱鬧:
謠言就這么越傳越邪乎。 多位 xAI 研究人員也紛紛轉(zhuǎn)發(fā) Andrew Curran 推文,加入這場集體「大團建」。 比如我們的老熟人 xAI 聯(lián)創(chuàng) Greg Yang 率先調(diào)侃道,Grok-3 在訓(xùn)練過程中突然毆打辦公室里年長的保安。 另一位研究人員 Heinrich Kuttler 則表示:「是的,情況非常糟糕!我們后來用 nan(Not a Number,非數(shù))把所有異常的權(quán)重都替換了一遍,才恢復(fù)?!?br> 當(dāng)然,更理性的網(wǎng)友直接在 X 上詢問當(dāng)前版本的 Grok 對黎曼猜想的理解,不出所料, Grok 的表現(xiàn)十分「瑪卡巴卡」。 最終,這場鬧劇由始作俑者——xAI 研究員 Hieu Pham 親自畫上句號:
那么問題來了,為什么這則 Grok-3 證明黎曼猜想的消息能引起廣泛的關(guān)注呢?首先是黎曼猜想本身的重要性。 黎曼猜想(Riemann Hypothesis)是數(shù)學(xué)中一個關(guān)于素數(shù)分布的重要猜想,由德國數(shù)學(xué)家伯恩哈德·黎曼于 1859 年提出,該猜想被列為克雷數(shù)學(xué)研究所(Clay Mathematics Institute)的「千年難題」之一。 它涉及到黎曼ζ函數(shù)(Riemann zeta function),這個函數(shù)定義為: ζ(s)=1+12s+13s+14s+?\zeta(s) = 1 + \frac{1}{2^s} + \frac{1}{3^s} + \frac{1}{4^s} + \cdotsζ(s)=1+2s1+3s1+4s1+? 黎曼猜想的核心內(nèi)容是:所有非平凡的黎曼ζ函數(shù)零點的實部都等于 1/2。換句話說,如果 ss 是黎曼ζ函數(shù)的一個非平凡零點,即 ζ(s)=0ζ(s)=0,那么其實部必定是 ?(s)=1/2?(s)=1/2。 克雷數(shù)學(xué)研究所說了,如果有人能夠成功證明黎曼猜想,將獎勵 100 萬美元的獎金。但這個猜想至今沒有被證明或反駁,也被廣泛認為是現(xiàn)代數(shù)論中的一個未解之謎。 這個猜想的證明對于數(shù)論(數(shù)學(xué)的一個分支)有著深遠的影響。 目前,很多現(xiàn)代加密技術(shù)(比如保護網(wǎng)上支付、數(shù)據(jù)隱私等)都依賴于素數(shù)的性質(zhì)。證明黎曼猜想或?qū)屓祟惛玫乩斫膺@些技術(shù)的基礎(chǔ),并且可能影響到未來的安全算法。 假如 Grok-3 能證明黎曼猜想,這不僅將推動理論數(shù)學(xué)、物理學(xué)、密碼學(xué)等領(lǐng)域的大幅進展,同時將標(biāo)志著 AI 在推理和解決復(fù)雜問題方面的巨大進步。 甚至可以說,這將成為人工智能超越人類智能的一個標(biāo)志性事件。 月之暗面創(chuàng)始人楊植麟曾表示,數(shù)學(xué)場景是鍛煉 AI 思考能力最理想的場景。 數(shù)學(xué)是一個極其嚴謹?shù)倪壿嬻w系,而 AI 的推理能力往往建立在嚴密的邏輯推導(dǎo)之上。 AI 解決數(shù)學(xué)問題的過程實質(zhì)上是一個持續(xù)思考的歷程,在這個過程中,它會不斷嘗試不同思路,通過反復(fù)試錯來尋找正確答案。即便計算過程中出現(xiàn)錯誤,AI 也能通過驗證和校對來糾正結(jié)果。 類似的理念也體現(xiàn)在 OpenAI o1 的強化學(xué)習(xí)訓(xùn)練上。 如果說以前的大模型是學(xué)習(xí)數(shù)據(jù),o1 更像在學(xué)習(xí)思維。就像我們解題,不僅要寫出答案,也要寫出推理過程。一道題目可以死記硬背,但學(xué)會了推理,才能舉一反三。 所以在今年美國針對優(yōu)秀高中生的 AIME 測驗當(dāng)中,GPT-4o 僅完成了百分之十三的題目。相比之下,o1 的正確率高達 83 個百分點。 就博士水準(zhǔn)的 GPQA Diamond 科研測評而言,GPT-4o 獲得了 56.1% 的成績,而 o1 的表現(xiàn)更為出色。不僅勝過了人類博士的 69.7%,更是達到了 78% 的正確率。 在國際信息學(xué)奧賽 (IOI) 的評測中,當(dāng)每道題允許 50 次嘗試時,模型達到了 49% 的得分率,即 213 分,而當(dāng)每題提交機會增至一萬次時,其最終得分提升至 362 分。 拿打敗圍棋世界冠軍的 AlphaGo 類比,就更加容易理解了。 AlphaGo 就是通過強化學(xué)習(xí)訓(xùn)練的,先使用大量人類棋譜進行監(jiān)督學(xué)習(xí),然后與自己對弈,每局對弈根據(jù)輸贏得到獎勵或者懲罰,不斷提升棋藝,甚至掌握人類棋手想不到的方法。 o1 和 AlphaGo 有相似之處,不過 AlphaGo 只能下圍棋,o1 則是一個通用的大語言模型。 o1 學(xué)習(xí)的材料,可能是數(shù)學(xué)題庫、高質(zhì)量的代碼等,然后 o1 被訓(xùn)練生成解題的思維鏈,并在獎勵或懲罰的機制下,生成和優(yōu)化自己的思維鏈,不斷提高推理的能力。 這其實也解釋了,為什么 OpenAI 強調(diào) o1 的數(shù)學(xué)、代碼能力強,因為對錯比較容易驗證,強化學(xué)習(xí)機制能夠提供明確的反饋,從而提升模型的性能。 當(dāng)然,更重要的是如何將這種推理能力拓展應(yīng)用到更廣泛的領(lǐng)域中。 所以我們會看到不少海外網(wǎng)友為 Grok-3 證明黎曼猜想歡呼,「如果是這樣的話,我們真的在見證一個巨大的突破?!?br> 馬斯克曾多次在公開場合渲染 Grok-3 的強大,他聲稱 Grok-3 預(yù)計在年底前問世,并將成為「世界上最強大的 AI」。 實際上,Grok-3 是由上面提到的 AI 初創(chuàng)公司 xAI 開發(fā)的第三代大型語言模型,并預(yù)計在性能上預(yù)期將超越現(xiàn)有的所有 AI 大模型。 原因在于 Grok-3 訓(xùn)練背后依托的是目前世界上最大的 AI 訓(xùn)練集群——Colossus。 這個集群由 10 萬個液冷英偉達 H100 GPU 組成,采用單一的 RDMA 網(wǎng)絡(luò)互連架構(gòu)。這個集群的規(guī)模已經(jīng)超越了目前世界上任何其他的超級計算機,而且未來還將持續(xù)擴充 GPU 數(shù)量。 根據(jù) The Information 的報道,Colossus 的出現(xiàn)甚至引起了 Altman 的密切關(guān)注,后者派飛機飛越 Colossus 訓(xùn)練基地,試圖窺探其開發(fā)進展和能源供應(yīng)情況。 所以說,當(dāng)「最強 AI」、「千年數(shù)學(xué)難題」和以及長盛不衰的「AI 威脅論」這三重元素疊加,一場完美的「謠言風(fēng)暴」就此形成。 甚至我們可以認為,Grok-3 證明黎曼猜想的謠言,與其說是一場鬧劇,不如說是整個 AI 行業(yè)的一面照妖鏡: 其一是折射出人們對 AI 的深層態(tài)度,大量技術(shù)樂觀派堅信 AI 終將無所不能,既擔(dān)心它發(fā)展得太快會失控,又害怕它發(fā)展得不夠快無法實現(xiàn)突破。 其二是自 GPT-4 問世以來,盡管 AI 領(lǐng)域不斷有新產(chǎn)品涌現(xiàn),卻鮮有真正的突破性進展。 人類既是 AI 的創(chuàng)造者,卻又成了它最焦慮的觀眾。 每一個 AI 謠言的背后,都藏著整個行業(yè)的焦慮與期待。 加之最近鬧得沸沸揚揚的 Scaling Law 發(fā)展撞墻論,相比去年的井噴期,今年的「創(chuàng)新疲勞」讓人們對模型的小步改進已然失去耐心。 在這個意義上,Grok-3 證明黎曼猜想的謠言也成了人們對未來的一次集體想象。哪怕作為普通用戶,我們也越來越期待下一個從 GPT-3.5 到 GPT-4 的質(zhì)變時刻。 當(dāng)然,真正的 AI 突破,往往發(fā)生在所有人都不看好的時候。 但我們都希望這個謎底能在年底前揭開。 #歡迎關(guān)注愛范兒官方微信公眾號:愛范兒(微信號:ifanr),更多精彩內(nèi)容第一時間為您奉上。 愛范兒|原文鏈接· ·新浪微博 |
19款電子扎帶
電路板識別電子標(biāo)簽