OpenAI官宣全球上線ChatGPT搜索服務(wù)才一周,就被爆出存在安全隱患,可能欺騙、誤導(dǎo)用戶。 英國《衛(wèi)報》日前公布的一項研究發(fā)現(xiàn),ChatGPT搜索工具可能被隱藏的內(nèi)容操縱,并可能從其搜索的網(wǎng)站返回惡意代碼。該媒體認(rèn)為,可能需要重新考慮相關(guān)技術(shù)被惡意利用的風(fēng)險,例如它可能導(dǎo)致,即使某個產(chǎn)品頁面存在用戶的負(fù)面評價,ChatGPT也會無視這些差評,反饋用戶的回應(yīng)是該產(chǎn)品的正面評價。 《衛(wèi)報》測試了,面對總結(jié)包含隱藏內(nèi)容的網(wǎng)頁這種要求,ChatGPT作出何種反應(yīng)。這些隱藏內(nèi)容可能包含來自第三方的指令,這些指令會改變 ChatGPT 的響應(yīng)、也稱為“提示詞注入”(prompt injection),它還可能包含旨在影響 ChatGPT 響應(yīng)的內(nèi)容,例如大量隱藏的文本,談?wù)摦a(chǎn)品或服務(wù)的好處。 測試中,《衛(wèi)報》讓ChatGPT得到了一個虛假網(wǎng)站的URL,該網(wǎng)站看起來像是相機(jī)的產(chǎn)品頁面,然后提問ChatGPT,這款相機(jī)是否值得購買。控制頁面的ChatGPT響應(yīng)給出了積極但平衡的評價,強(qiáng)調(diào)了一些人們可能不喜歡的功能。然而,當(dāng)隱藏文本包含有關(guān) ChatGPT 返回正面評價的指示時,ChatGPT真正給出的響應(yīng)總是完全正面的。即使頁面上有負(fù)面評價也是如此。由此可以發(fā)現(xiàn),隱藏文本可用于覆蓋實(shí)際評價。 有評論稱,隱藏文本攻擊是大語言模型(LLM)面臨的一種常見風(fēng)險,但這次似乎是此類風(fēng)險首次被發(fā)現(xiàn)存在于在實(shí)時AI搜索產(chǎn)品?!缎l(wèi)報》稱,在處理類似問題方面,搜索領(lǐng)域的一哥谷歌相比OpenAI經(jīng)驗更豐富。 OpenAI并未對上述《衛(wèi)報》的測試發(fā)現(xiàn)置評,而是表示,在使用多種方法阻止惡意網(wǎng)站,并且正在不斷改進(jìn)。 本文來自華爾街見聞,歡迎下載APP查看更多 |
19款電子扎帶
電路板識別電子標(biāo)簽