去年11月以來,一款名為“ChatGPT”的聊天機器人程序開始在海外爆火,到今年2月份,ChatGPT更成為幾乎每天都能見到相關(guān)熱搜的“頂流”。 熱烈的討論聲中,很多人驚呼:“《流浪地球2》里那個不斷自我學(xué)習(xí),最終演化出自主思維的‘MOSS’,或許離我們已經(jīng)不遠?!?br> 也有人認(rèn)為,ChatGPT與Siri、小愛同學(xué)、小度等人們熟悉的智能助手沒有本質(zhì)區(qū)別,不值得過多關(guān)注。 網(wǎng)友讓它寫詩、寫小說、寫工作簡報、寫朋友圈文案,甚至用它寫代碼、寫論文……ChatGPT究竟是一款怎樣的產(chǎn)品?它緣何突然爆火?它能做到哪些事情?會有人因此被“搶飯碗”嗎?未來發(fā)展將走向何方?我們采訪到業(yè)界專家和多位ChatGPT使用者,試圖解答這些問題。 “不是新東西”的ChatGPT 突然就火了? ChatGPT,全稱是“Chat Generative Pre-trained Transformer”,可直譯為“作交談用的生成式預(yù)先訓(xùn)練變換器”。它是美國公司OpenAI研發(fā)的聊天機器人程序,能用于問答、文本摘要生成、機器翻譯、分類、代碼生成和對話AI。 到今年1月,ChatGPT僅用不到兩個月時間,就累計了超過1億用戶,打破了此前Tik Tok用九個月時間將用戶數(shù)累計到1億的速度。 南開大學(xué)計算機學(xué)院、網(wǎng)絡(luò)空間安全學(xué)院副院長劉曉光表示,雖然ChatGPT進入大眾視野的時間并不長,但OpenAI的GPT產(chǎn)品幾年前就已在從業(yè)者中產(chǎn)生巨大影響。從技術(shù)層面來說,ChatGPT并不是個新東西。 “2016—2020年,OpenAI陸續(xù)發(fā)布了GPT的1.0、2.0、3.0版本,去年11月底發(fā)布的ChatGPT可以視作GPT-3.5。雖然大多數(shù)普通人是最近才知道‘GPT’這種利用大數(shù)據(jù)的預(yù)訓(xùn)練大模型,但更早的GPT-3已經(jīng)在計算機學(xué)界和業(yè)界產(chǎn)生很大的影響。國內(nèi)一些互聯(lián)網(wǎng)公司早在這波熱潮前,就擁有自己的預(yù)訓(xùn)練大模型項目?!?br> 劉曉光認(rèn)為,ChatGPT之所以能夠突然爆火,可能有這樣幾個原因:“一是此前幾代GPT更多是面向商界提供技術(shù)支持,而ChatGPT則是直接面向大眾,誰都可以提問,回答也只需等幾秒,更多的人能簡單而直觀地了解它的作用;二是它發(fā)布時正值國外的大學(xué)考試季,很多學(xué)生拿它寫論文、交作業(yè),而ChatGPT能給出相對完整的回答,解決了學(xué)生的實際問題,由此迎來用戶快速增長。當(dāng)然,它火熱到一定程度后,也不排除有科技巨頭企業(yè)、科技媒體的過度關(guān)注和一些炒作現(xiàn)象?!?br> “好得嚇人”? ChatGPT突破了怎樣的難點? 去年12月,埃隆·馬斯克曾公開表示ChatGPT“好得嚇人”(scary good),并認(rèn)為強大到危險的人工智能已經(jīng)離我們不遠。微軟聯(lián)合創(chuàng)始人比爾·蓋茨接受媒體采訪時表示:“ChatGPT將改變我們的世界?!苯?,京東集團副總裁何曉冬接受媒體采訪時表示:“ChatGPT是第一款真正意義上的人工智能原生的產(chǎn)品,就像第一款iPhone,一出來就展現(xiàn)出高完整度,高體驗性,高平臺性?!?br> 埃隆·馬斯克稱ChatGPT“好得嚇人” 行業(yè)巨頭為何如此高度評價ChatGPT?很多人表示不解。有網(wǎng)友在互聯(lián)網(wǎng)中提問:“能與人對話的Siri、小愛同學(xué)、小度等智能助手已然不少,若論及AI技術(shù),幾年前的阿爾法圍棋(AlphaGo)也曾引發(fā)極大關(guān)注,ChatGPT究竟特殊在哪里?” 劉曉光表示,在不少計算機領(lǐng)域業(yè)內(nèi)人士看來,ChatGPT的橫空出世,給AI領(lǐng)域帶來的沖擊,更甚于七年前的AlphaGo與圍棋世界冠軍、職業(yè)九段棋手李世石進行并獲勝的那場圍棋人機大戰(zhàn)。 “從30年前IBM開發(fā)的國際象棋電腦‘深藍’戰(zhàn)勝世界冠軍卡斯帕羅夫,到幾年前AlphaGo戰(zhàn)勝人類圍棋冠軍,其間雖有算法、算力的巨大差異,但本質(zhì)上仍沒有跳出‘讓計算機在固定場景下干固定的事’這個范疇,而這恰好是計算機最擅長做的事。”劉曉光介紹道,“而ChatGPT面對的是一個‘open world’——上億用戶要問它什么問題,完全是不可預(yù)知的。ChatGPT需要根據(jù)具體場景,自行組織各種回答。這恰恰是AI開發(fā)的難點,而ChatGPT在很多時候表現(xiàn)得很好。” 關(guān)于“open world”場景下AI運作之難,劉曉光做了一個簡單類比:“如今的智能駕駛技術(shù)大多仍應(yīng)用于礦山、港口和室內(nèi)工廠等特定的封閉環(huán)境,這種‘close world’不會讓AI遇到太復(fù)雜的問題。相對的,公共道路上的智能駕駛則難實現(xiàn)得多。其中一個原因,就是AI面對開放的、不可預(yù)知的環(huán)境時,其運作難度指數(shù)級上升?!?br> 劉曉光認(rèn)為,從核心概念來看,ChatGPT相比于Siri、小愛同學(xué)、小度等智能助手,其本質(zhì)仍是語言模型,核心技術(shù)并沒有顛覆性創(chuàng)新。區(qū)別在于,ChatGPT的模型足夠大、有更多的數(shù)據(jù)以供訓(xùn)練、處理數(shù)據(jù)的軟硬件能力更強,而Siri、小愛同學(xué)等軟件的學(xué)習(xí)能力、數(shù)據(jù)量都要差很多,甚至可以說是質(zhì)的差別。 “ChatGPT在學(xué)習(xí)能力、數(shù)據(jù)處理量上的優(yōu)勢,讓它所能處理問題的邊界大大拓寬,甚至可以說,它是一款完全不同的產(chǎn)品。有研究者的觀察分析表明,ChatGPT已展現(xiàn)出一個接受過大學(xué)教育的普通本科生的知識水平。這與此前同類產(chǎn)品有著云泥之別,也是讓業(yè)界震驚的地方。” 一場“調(diào)戲”ChatGPT的狂歡 圍觀機器人“一本正經(jīng)地胡說八道” 值得注意的是,ChatGPT在中文互聯(lián)網(wǎng)爆火后,很快引發(fā)了一場意料之外的狂歡——用戶們爭先恐后地“調(diào)戲”它。 與蘋果的智能語音助手Siri遇到復(fù)雜問題時動輒回答“對不起,我好像不太明白”不同,ChatGPT展現(xiàn)著一種盡可能用自身邏輯組織語言、回答問題的傾向。甚至對很多人們一眼看上去像是在搞怪的問題,它也會給出答案。這種“一本正經(jīng)地強答”,讓用戶產(chǎn)生了極大興趣。 一些“強答”反映了ChatGPT有時并不能完全理解自己所回答的問題。例如,當(dāng)問及“為什么房子不蓋成實心的”時,ChatGPT會“不厭其煩”地從空氣無法流動、沒有通風(fēng)系統(tǒng)等方面論述這樣的房子對健康不利,但似乎沒有“意識”到這樣的房子本就無法住人。 網(wǎng)友“調(diào)戲”ChatGPT的問題(圖片來自網(wǎng)絡(luò)) 涉及專業(yè)知識類的問答,同樣鬧出了不少笑話。B站一位歷史區(qū)up主詢問ChatGPT幾個問題后得到的答案顯示,ChatGPT會混淆春秋戰(zhàn)國時期七雄之一的魏國、三國時期割據(jù)政權(quán)之一的曹魏,以及十六國時期鮮卑拓跋氏建立的北魏。無獨有偶,ChatGPT還會將“南朝宋”與“南宋”張冠李戴。 ChatGPT“一本正經(jīng)地胡說八道”(圖片來源:b站up主“稚嫩的魔法師”) 由此導(dǎo)致的結(jié)果,往往是亂答一通。一位歷史學(xué)博士告訴記者,這些“一本正經(jīng)地胡說八道”的答案固然好笑,但奇怪的是,它的回答在邏輯表達上卻似模似樣,不像是隨意從網(wǎng)上抄來的,“我看到有人使用ChatGPT問一些學(xué)術(shù)問題,它給出的答案甚至包含了引用論文、論文號等等細節(jié),結(jié)果一查,這些‘參考文獻’全是chatGPT自己編的,讓人啼笑皆非。真不知道它是怎么得出這種答案的。” “要討論ChatGPT‘胡說八道’的緣由,就不得不提到此類產(chǎn)品目前的一個缺陷,就是可解釋性很差——預(yù)訓(xùn)練大模型中的神經(jīng)網(wǎng)絡(luò)存在成千上萬層,AI通過深度學(xué)習(xí),自行構(gòu)造出一個復(fù)雜規(guī)則。人們能看到的,往往只是它針對問題所輸出的一個結(jié)果。因此,無論答案是正確還是錯誤,人們都很難對AI為何得出該答案進行解釋?!眲怨庹f道。 多位使用過ChatGPT的用戶告訴記者,ChatGPT的回答很少出現(xiàn)“句不成句”式的表述硬傷,但卻不時出現(xiàn)邏輯與事實錯誤。越冷門、越小眾的領(lǐng)域,這種錯誤就越明顯。 出現(xiàn)這種現(xiàn)象,或與ChatGPT所學(xué)習(xí)、訓(xùn)練的數(shù)據(jù)構(gòu)成有關(guān)。“眾所周知,一個產(chǎn)品用得人越多,往往就變得越來越好用,這是因為用戶的使用行為本身就是一種反饋機制,能夠幫產(chǎn)品自我改進。ChatGPT也是如此,在問題集中的領(lǐng)域,它有更多的樣本去學(xué)習(xí)、訓(xùn)練、自糾;而偏門的知識領(lǐng)域,ChatGPT就缺乏足夠數(shù)據(jù)來深度學(xué)習(xí),于是就會‘胡說一番’?!眲怨獗硎荆罱褂肅hatGPT的過程中,當(dāng)詢問常見問題、新聞事件等,往往能獲得比較準(zhǔn)確的答案,而一旦詢問相對偏門的知識,ChatGPT就開始明顯地“放飛自我”。 由此衍生的另一個話題,就是ChatGPT輸出答案的可靠性——它給出的結(jié)果是否正確,將由誰來判斷?如果無法判斷,也就無法進行正確的反饋。而眾所周知,正確的反饋對產(chǎn)品迭代十分重要。 另一方面,大量“胡說八道”式的垃圾內(nèi)容被ChatGPT生產(chǎn)出來,似是而非、經(jīng)不起二次校正的不可信內(nèi)容廣泛出現(xiàn),會削弱整個內(nèi)容平臺的公信力,讓人們對ChatGPT或同類產(chǎn)品的可靠性產(chǎn)生質(zhì)疑。 畢竟,在當(dāng)下這個充斥海量信息的社會中,相比于“信息密度”,人們往往更渴求的是“信息精度”。 “飯碗不?!?? 人們該擔(dān)憂嗎? ChatGPT橫空出世所引發(fā)的另一個爭論,則相對更加嚴(yán)肅現(xiàn)實:會有人的工作崗位被ChatGPT取代嗎? 自有AI技術(shù)誕生以來,類似的話題就不絕于耳。但要回答這個問題,就要跳出對AI技術(shù)的盲目崇拜與“調(diào)戲”式的玩鬧心態(tài),嚴(yán)肅地正視一個問題:ChatGPT目前究竟能干什么,或者即將能干什么? 對這個問題,ChatGPT自己給出了聊天機器人、自動文本生成、自動翻譯、情感分析、內(nèi)容摘要、數(shù)據(jù)分析、虛擬助理等具體應(yīng)用的場景。事實上,在這些領(lǐng)域中,ChatGPT已證明了自己比此前所有產(chǎn)品都要做得好,而且好得多。 劉曉光認(rèn)為,長遠來看,技術(shù)進步帶來業(yè)態(tài)調(diào)整是必然結(jié)果。但一項新技術(shù)是否將帶來就業(yè)沖擊,以及具體將帶來何種沖擊,歸根結(jié)底還是要看技術(shù)落地的順利程度。 “目前來看,ChatGPT對圖片制作、文字生成、媒體內(nèi)容生產(chǎn)、虛擬人服務(wù)、工作匯報、翻譯、編程、搜索引擎等領(lǐng)域會造成較大沖擊。就在2月7日,微軟已宣布推出有ChatGPT支持的最新版本人工智能搜索引擎必應(yīng)(Bing)和Edge瀏覽器,這已然極大地改變了搜索引擎的競爭格局——毫無疑問地,從‘逐條抓取數(shù)據(jù)’到‘直接給用戶呈現(xiàn)答案’,這必然是更符合用戶需求的方向??梢钥吹?,新技術(shù)的更迭如火如荼,有時人們說巨大變革就在眼前,并非夸大其詞。”劉曉光介紹道。 內(nèi)嵌了ChatGPT的Bing搜索,直接制訂了提問者想要的訓(xùn)練計劃 但劉曉光同時表示,正如前面所指出ChatGPT尚存在缺陷,其回答仍時常表現(xiàn)出不可靠性:“就拿ChatGPT所呈現(xiàn)的文字表達來說,要將它應(yīng)用于實際場景,還離不開人的指導(dǎo)、檢查與驗證?!?br> 從社會分工的角度來說,面對ChatGPT的沖擊,首當(dāng)其沖的是重復(fù)性勞動較多的、不需要太多創(chuàng)造力的工作。而創(chuàng)造力,正是當(dāng)前如何拼算力、燒財力,也無法讓AI輕易跨越的一道鴻溝。 “人為什么會擁有創(chuàng)造力?迄今為止,這個問題連人類自己都無法說清,更遑論把創(chuàng)造力教給機器了。到目前為止,AI最擅長的仍然是‘照章辦事’,本質(zhì)上還突破不了‘創(chuàng)造力’這一關(guān),ChatGPT也不例外?!眲怨庹f道,“如果哪天AI突破了創(chuàng)造力這一關(guān),那么人們要擔(dān)心的,也不僅僅是某幾個行業(yè)的就業(yè)崗位問題了——屆時整個人類社會都會面臨翻天覆地的變化?!?br> 預(yù)訓(xùn)練大模型 未來將走向何方? 早在2015年奧特曼、彼得·泰爾、里德·霍夫曼和埃隆·馬斯克等一群科技領(lǐng)袖創(chuàng)立OpenAI時,OpenAI還是一家非營利企業(yè)。公司創(chuàng)始人們認(rèn)為,要避免人工智能技術(shù)壟斷在少數(shù)巨頭手中,要通過開源促進技術(shù)開放。 但隨著項目進展,訓(xùn)練機器學(xué)習(xí)模型所需的資金越來越龐大,OpenAI開始成立一家營利性分支機構(gòu)。2019年,風(fēng)險投資人微軟入局。時至今日,微軟和OpenAI 之間的財務(wù)命運和技術(shù)變得越來越融合,今年1月份,隨著ChatGPT的爆火,微軟又向OpenAI追加了100億美元的投資。 當(dāng)前,ChatGPT仍處于免費試用狀態(tài),但不斷有消息稱其將很快推出收費版本。同時,Bing搜索已內(nèi)嵌ChatGPT,更有消息稱微軟或?qū)袰hatGPT嵌入Office辦公軟件中,這不啻將是對辦公生態(tài)的又一次革新。 內(nèi)嵌了ChatGPT的Bing搜索在寫詩 “預(yù)訓(xùn)練大模型”類軟件將走向何方?在業(yè)內(nèi)人士看來,雖然ChatGPT的核心理論已不算新鮮,但開發(fā)同類產(chǎn)品所需的資金和人力,某種程度上已構(gòu)成了新的門檻。 “早在前一代GPT中,模型訓(xùn)練一次的花費就高達千萬乃至上億美元,非常昂貴。OpenAI預(yù)計將在今年內(nèi)發(fā)布GPT-4,那將是萬眾期待的進一步升級,同時也意味著它需要更多數(shù)據(jù)和更高計算力,這些都需要大量資金和人力。因此,開發(fā)同類產(chǎn)品的門檻在不斷變高?!眲怨庹f道。 大勢之下,國內(nèi)計算機業(yè)界有哪些機遇和挑戰(zhàn)?劉曉光認(rèn)為,當(dāng)前國內(nèi)外公司在開發(fā)預(yù)訓(xùn)練大模型產(chǎn)品的核心理論上,存在的差距并不算很大,但在數(shù)據(jù)采集、數(shù)據(jù)分析處理的能力上,“后來者”們?nèi)杂幸汾s的距離。 “如果把機器賴以訓(xùn)練、學(xué)習(xí)的數(shù)據(jù)比作食材,那這種食材就需要通過收集、處理變成適合吸收的樣子,這不是一項簡單的工作。無論文字還是圖片、視頻,它們一般都需要進行人工標(biāo)注,這不是短時間投入大量資金就能立刻見效的事,而是需要很多人力和時間的積累。因此業(yè)內(nèi)也有說法稱,數(shù)據(jù)才是互聯(lián)網(wǎng)企業(yè)最重要的資產(chǎn),甚至有人將數(shù)據(jù)比作企業(yè)的‘護城河’。”劉曉光說道。 “預(yù)訓(xùn)練大模型”類軟件未來將如何發(fā)展?劉曉光認(rèn)為或許將指向三個特征:“一是數(shù)據(jù)量越來越大,計算力越來越強,包羅萬象;二是向?qū)I(yè)化領(lǐng)域進軍,在某一細分領(lǐng)域把信息精度做向極致,如醫(yī)療、法律、體育、編程等垂直分類;三是與具體應(yīng)用場景深度結(jié)合,不僅僅停留在‘chat’,而是與虛擬人表演、電商營銷、售后客服、陪護老幼人群、文藝創(chuàng)作等場景相結(jié)合。ChatGPT所展現(xiàn)的潛力,預(yù)示著它有能力在這些領(lǐng)域大有作為。” 來源: 天津日報 |