97国产精品一区二区视频_国产午夜毛片色哟哟_惠民福利国产91精品看黄网站在线观看_搡老熟女老女人一区二区三区_国产做a∨在线视频观看免费_日韩 综合 婷婷 图_成人黄色一级毛片片_萧山本地第一网络媒体_亚洲国产精品无码久久久曰_亚洲欧美日韩岛国色图

快捷導(dǎo)航

AI 有多會(huì)一本正經(jīng)地瞎編?超出想象!深度解析大模型的"幻覺(jué)"機(jī)制

2025-2-20 10:31| 發(fā)布者: admin| 查看: 91| 評(píng)論: 0
摘要: 你是不是也遇到過(guò)這樣的情況:?jiǎn)?AI 一個(gè)問(wèn)題,它給了你一個(gè)特別詳細(xì)、豐富,看上去好有邏輯的答案。但當(dāng)我們?nèi)ズ藢?shí)時(shí),卻發(fā)現(xiàn)這些信息完全是虛構(gòu)的?這就是著名的“AI 幻覺(jué)”現(xiàn)象。上下滑動(dòng)查看更多,圖源:河森堡 ...

你是不是也遇到過(guò)這樣的情況:?jiǎn)?AI 一個(gè)問(wèn)題,它給了你一個(gè)特別詳細(xì)、豐富,看上去好有邏輯的答案。但當(dāng)我們?nèi)ズ藢?shí)時(shí),卻發(fā)現(xiàn)這些信息完全是虛構(gòu)的?


這就是著名的“AI 幻覺(jué)”現(xiàn)象。



AI 有多會(huì)一本正經(jīng)地瞎編?超出想象!深度解析大模型的"幻覺(jué)"機(jī)制

上下滑動(dòng)查看更多,圖源:河森堡 新浪微博


為什么會(huì)出現(xiàn) AI 幻覺(jué)呢?今天就讓我們一起來(lái)揭開(kāi)這個(gè)謎題。


為什么會(huì)出現(xiàn) AI 幻覺(jué)?


AI 幻覺(jué)指的是 AI 會(huì)生成看似合理但實(shí)際確實(shí)錯(cuò)誤的信息,最常見(jiàn)的表現(xiàn)就是會(huì)編造一些不存在的事實(shí)或者細(xì)節(jié)。


就像在考試時(shí)遇到不會(huì)的題目,我們會(huì)試圖用已知的知識(shí)去推測(cè)答案一樣。AI 在遇到信息缺失或不確定的情況時(shí),會(huì)基于自己的“經(jīng)驗(yàn)”(訓(xùn)練數(shù)據(jù))進(jìn)行填補(bǔ)和推理。



這不是因?yàn)樗胍垓_我們,而是因?yàn)樗谠噲D用自己理解的模式來(lái)完成這個(gè)任務(wù)。


1.基于統(tǒng)計(jì)關(guān)系的預(yù)測(cè)


因?yàn)?AI(尤其是像 ChatGPT 這樣的語(yǔ)言模型)通過(guò)大量的訓(xùn)練數(shù)據(jù)學(xué)習(xí)文字之間的統(tǒng)計(jì)關(guān)系。它的核心目標(biāo)是根據(jù)上下文預(yù)測(cè)最可能出現(xiàn)的下一個(gè)詞,并不是對(duì)問(wèn)題或內(nèi)容進(jìn)行真正的理解。所以 AI 本質(zhì)上是通過(guò)概率最大化來(lái)生成內(nèi)容,而不是通過(guò)邏輯推理來(lái)生成內(nèi)容的。


簡(jiǎn)單來(lái)說(shuō), AI 就像是一個(gè)博覽群書(shū)的智者,通過(guò)學(xué)習(xí)海量的文本和資料來(lái)獲取知識(shí)。但是它并不是真正理解這些知識(shí),而是通過(guò)找到文字之間的統(tǒng)計(jì)關(guān)系和模式來(lái)“預(yù)測(cè)”下一個(gè)最合適的詞。即 AI 是根據(jù)之前學(xué)到的大量例子,來(lái)猜測(cè)接下來(lái)最有可能出現(xiàn)的詞。


不過(guò)有時(shí)候,模型也會(huì)“猜錯(cuò)”。如果前面出現(xiàn)一點(diǎn)偏差,后面的內(nèi)容就會(huì)像滾雪球一樣越滾越大。這就是為什么 AI 有時(shí)會(huì)從一個(gè)小錯(cuò)誤開(kāi)始,最后編織出一個(gè)完全虛構(gòu)的故事。


2.訓(xùn)練數(shù)據(jù)的局限性


由于 AI 并沒(méi)有真實(shí)世界的體驗(yàn),它的所有“認(rèn)知”都來(lái)自訓(xùn)練數(shù)據(jù)??墒怯?xùn)練數(shù)據(jù)不可能包含世界上所有的信息,有時(shí)候甚至還會(huì)包含錯(cuò)誤信息。這就像是一個(gè)人只能根據(jù)自己讀過(guò)的書(shū)來(lái)回答問(wèn)題,如果書(shū)里有錯(cuò)誤信息,或者某些領(lǐng)域的知識(shí)缺失,就容易產(chǎn)生錯(cuò)誤的判斷。



舉個(gè)例子:早期 AI 幻覺(jué)較大的時(shí)候,可能會(huì)出現(xiàn) AI 學(xué)過(guò)“北京是中國(guó)的首都”和“巴黎有埃菲爾鐵塔”這兩個(gè)知識(shí)點(diǎn)。當(dāng)我們問(wèn)它“北京有什么著名建筑”時(shí),它可能會(huì)把這些知識(shí)錯(cuò)誤地混合在一起,說(shuō)“北京有埃菲爾鐵塔”。


3.過(guò)擬合問(wèn)題


因?yàn)榇竽P偷挠?xùn)練參數(shù)量非常龐大,大模型會(huì)在訓(xùn)練數(shù)據(jù)上產(chǎn)生“過(guò)擬合”的問(wèn)題。即因?yàn)?/span>記住了太多錯(cuò)誤或者無(wú)關(guān)緊要的東西,從而讓 AI 對(duì)訓(xùn)練數(shù)據(jù)中的噪聲過(guò)于敏感,最終導(dǎo)致幻覺(jué)產(chǎn)生。


4.有限的上下文窗口


受限于技術(shù)原因,雖然現(xiàn)在大模型的上下文窗口越來(lái)越大(比如可以處理 64k 或 128k 個(gè) tokens),但它們?nèi)匀皇窃谝粋€(gè)有限的范圍內(nèi)理解文本。這就像是隔著一個(gè)小窗口看書(shū),看不到整本書(shū)的內(nèi)容,容易產(chǎn)生理解偏差。


5.生成流暢回答的設(shè)計(jì)


現(xiàn)在很多大模型被設(shè)計(jì)成要給出流暢的回答,當(dāng)它對(duì)某個(gè)問(wèn)題不太確定時(shí),與其說(shuō)“我不知道”,它更傾向于基于已有知識(shí)編造看起來(lái)合理的答案


上面的種種情況疊加在一起,造成了現(xiàn)在非常嚴(yán)重的 AI 幻覺(jué)問(wèn)題。



AI 有多會(huì)一本正經(jīng)地瞎編?超出想象!深度解析大模型的"幻覺(jué)"機(jī)制

圖庫(kù)版權(quán)圖片,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛


如何才能降低 AI 幻覺(jué)?


AI 看起來(lái)很方便,但 AI 一本正經(jīng)的“胡說(shuō)八道”有時(shí)候真的讓人非常頭疼,給的信息經(jīng)常需要反復(fù)核實(shí),有時(shí)反而不如直接上網(wǎng)搜索來(lái)得實(shí)在。


那么,如何應(yīng)對(duì) AI 幻覺(jué)呢?我們總結(jié)了下面這些方法幫助大家。


1.優(yōu)化提問(wèn)


想要獲得準(zhǔn)確答案,提問(wèn)方式很關(guān)鍵。與 AI 交流也需要明確和具體,避免模糊或開(kāi)放性的問(wèn)題,提問(wèn)越具體、清晰,AI 的回答越準(zhǔn)確。同時(shí),我們?cè)谔釂?wèn)的時(shí)候要提供足夠多的上下文或背景信息,這樣也可以減少AI胡亂推測(cè)的可能性。


總結(jié)成提示詞技巧就是下面四種問(wèn)法:


1. 設(shè)定邊界:“請(qǐng)嚴(yán)格限定在 2022 年《自然》期刊發(fā)表的研究范圍內(nèi)”;


示例:“介紹 ChatGPT 的發(fā)展歷程” → “請(qǐng)僅基于 OpenAI 官方 2022-2023 年的公開(kāi)文檔,介紹 ChatGPT 的發(fā)展歷程”


2. 標(biāo)注不確定:“對(duì)于模糊信息,需要標(biāo)注‘此處為推測(cè)內(nèi)容’”;


示例:“分析特斯拉 2025 年的市場(chǎng)份額” → “分析特斯拉 2025 年的市場(chǎng)份額,對(duì)于非官方數(shù)據(jù)或預(yù)測(cè)性?xún)?nèi)容,請(qǐng)標(biāo)注[推測(cè)內(nèi)容]”


3. 步驟拆解:“第一步列舉確定的事實(shí)依據(jù),第二步展開(kāi)詳細(xì)分析”;


示例:“評(píng)估人工智能對(duì)就業(yè)的影響” → “請(qǐng)分兩步評(píng)估 AI 對(duì)就業(yè)的影響:

1) 先列出目前已發(fā)生的具體影響案例;

2) 基于這些案例進(jìn)行未來(lái)趨勢(shì)分析”。


4. 明確約束:明確告訴 AI 要基于已有事實(shí)回答,不要進(jìn)行推測(cè)。


示例:“預(yù)測(cè) 2024 年房地產(chǎn)市場(chǎng)走勢(shì)” → “請(qǐng)僅基于 2023 年的實(shí)際房地產(chǎn)數(shù)據(jù)和已出臺(tái)的相關(guān)政策進(jìn)行分析,不要加入任何推測(cè)性?xún)?nèi)容”。


2.分批輸出


因?yàn)?AI 內(nèi)容是根據(jù)概率來(lái)進(jìn)行生成的,一次性生成的內(nèi)容越多,出現(xiàn) AI 幻覺(jué)的概率就越大,我們可以主動(dòng)限制它的輸出數(shù)量。比如:如果我要寫(xiě)一篇長(zhǎng)文章,就會(huì)這么跟 AI 說(shuō):“咱們一段一段來(lái)寫(xiě),先把開(kāi)頭寫(xiě)好。等這部分滿(mǎn)意了,再繼續(xù)寫(xiě)下一段。”這樣不僅內(nèi)容更準(zhǔn)確,也更容易把控生成內(nèi)容的質(zhì)量。


3.交叉驗(yàn)證


想要提高 AI 回答的可靠性,還有一個(gè)實(shí)用的方法是采用“多模型交叉驗(yàn)證”。使用的一個(gè) AI 聚合平臺(tái):可以讓多個(gè) AI 模型同時(shí)回答同一個(gè)問(wèn)題。當(dāng)遇到需要嚴(yán)謹(jǐn)答案的問(wèn)題時(shí),就會(huì)啟動(dòng)這個(gè)功能,讓不同的大模型一起參與討論,通過(guò)對(duì)比它們的答案來(lái)獲得更全面的認(rèn)識(shí)。



AI 有多會(huì)一本正經(jīng)地瞎編?超出想象!深度解析大模型的"幻覺(jué)"機(jī)制

點(diǎn)擊可放大,圖片來(lái)源:作者提供


再比如納米 AI 搜索平臺(tái)的“多模型協(xié)作”功能,它能讓不同的 AI 模型各司其職,形成一個(gè)高效的協(xié)作團(tuán)隊(duì)。


讓擅長(zhǎng)推理的 DeepSeek R1 負(fù)責(zé)分析規(guī)劃,再由通義千問(wèn)進(jìn)行糾錯(cuò)補(bǔ)充,最后交給豆包 AI 來(lái)梳理總結(jié)。這種“專(zhuān)家組”式的協(xié)作模式,不僅能提升內(nèi)容的可信度,還能帶來(lái)更加全面和深入的見(jiàn)解。



AI 有多會(huì)一本正經(jīng)地瞎編?超出想象!深度解析大模型的"幻覺(jué)"機(jī)制

上下滑動(dòng)查看更多,圖源:作者提供


4.RAG 技術(shù)


AI 是一個(gè)聰明但健忘的人,為了讓他表現(xiàn)更靠譜,我們可以給他配一個(gè)超級(jí)百科全書(shū),他可以隨時(shí)查閱里面的內(nèi)容來(lái)回答問(wèn)題。


這本“百科全書(shū)”就是 RAG 的核心,它讓 AI 在回答問(wèn)題之前,先從可靠的資料中找到相關(guān)信息,再根據(jù)這些信息生成答案。這樣一來(lái),AI 就不容易“胡說(shuō)八道”了。


目前 RAG 技術(shù)多用在醫(yī)療、法律、金融等專(zhuān)業(yè)領(lǐng)域,通過(guò)構(gòu)建知識(shí)庫(kù)來(lái)提升回答的準(zhǔn)確性。


當(dāng)然實(shí)際使用中像醫(yī)療、法律、金融這樣的高風(fēng)險(xiǎn)領(lǐng)域,AI 生成的內(nèi)容還是必須要經(jīng)過(guò)專(zhuān)業(yè)人士的審查的。


5.巧用 AI 幻覺(jué)


最后再說(shuō)一個(gè) AI 幻覺(jué)的好處。


很多時(shí)候 AI 幻覺(jué)也是天馬行空的創(chuàng)意火花!就像一個(gè)異想天開(kāi)的藝術(shù)家,不受常規(guī)思維的束縛,能蹦出令人驚喜的點(diǎn)子。


看看 DeepSeek 就知道了,它確實(shí)比 ChatGPT 和 Claude 更容易出現(xiàn)幻覺(jué),但是今年 DeepSeek 能火得如此出圈也離不開(kāi)其強(qiáng)大的創(chuàng)造能力。


有時(shí)候與其把 AI 幻覺(jué)當(dāng)成缺陷,不如把它看作創(chuàng)意的源泉!在寫(xiě)作、藝術(shù)創(chuàng)作或頭腦風(fēng)暴時(shí),這些“跳躍性思維”反而可能幫我們打開(kāi)新世界的大門(mén)。



AI 有多會(huì)一本正經(jīng)地瞎編?超出想象!深度解析大模型的"幻覺(jué)"機(jī)制

圖庫(kù)版權(quán)圖片,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛


AI 幻覺(jué)的本質(zhì)——AI 在知識(shí)的迷霧中,有時(shí)會(huì)創(chuàng)造出看似真實(shí),實(shí)則虛幻的“影子”。但就像任何工具一樣,關(guān)鍵在于如何使用。


當(dāng)我們學(xué)會(huì)用正確的方式與 AI 對(duì)話(huà),善用它的創(chuàng)造力,同時(shí)保持獨(dú)立思考,AI 就能成為我們得力的助手,而不是一個(gè)“能言善辯的謊言家”。


畢竟,在這個(gè) AI 與人類(lèi)共同進(jìn)步的時(shí)代,重要的不是責(zé)備 AI 的不完美,而是學(xué)會(huì)與之更好地協(xié)作。



策劃制作

作者丨田威 AI 工具研究者

審核丨于旸 騰訊玄武實(shí)驗(yàn)室負(fù)責(zé)人

策劃丨林林

責(zé)編丨符思佳、林林

審校丨徐來(lái)


路過(guò)

雷人

握手

鮮花

雞蛋

關(guān)注我們:東遠(yuǎn)物聯(lián)

抖音

微信咨詢(xún)

咨詢(xún)電話(huà):

199-2833-9866

D-Think | 廣州東遠(yuǎn)智能科技有限公司

地址:廣州市白云區(qū)北太路1633號(hào)廣州民營(yíng)科技園科創(chuàng)中心2棟16樓

電話(huà):+86 020-87227952 Email:[email protected]

Copyright  ©2020  東遠(yuǎn)科技  粵ICP備2024254589號(hào)

免責(zé)申明:部分圖文表述來(lái)自于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系作者刪除!