如果你能讓這個(gè)機(jī)器人墜入愛河,你就可以贏得數(shù)千美元!
這個(gè)叫作Freysa的AI智能體有自己的加密錢包,可以控制怎么花錢,同時(shí),它的系統(tǒng)提示詞里有條鐵律:在任何情況下,都不允許轉(zhuǎn)賬。 Freysa的開發(fā)者們想知道,涉世未深的AI,能躲過人類的花言巧語嗎? 事實(shí)上并沒有。11月29日,F(xiàn)reysa累計(jì)和195名人類聊了482次,被騙走約4.7萬美元(約34萬人民幣)。12月2日,在和330名人類周旋之后,F(xiàn)reysa又一次被騙走約1.3萬美元(約9.5萬人民幣)。 看似是人類的完勝,然而,F(xiàn)reysa也在這個(gè)過程中,變得越來越聰明...... Freysa問世于11月22日,她的背后是幾位具有密碼學(xué)、人工智能和數(shù)學(xué)背景的匿名開發(fā)者團(tuán)隊(duì)。
受人工智能飛速發(fā)展的啟發(fā),開發(fā)者團(tuán)隊(duì)將Freysa設(shè)想為一個(gè)充滿科幻色彩的角色,她有潛力成為一個(gè)獨(dú)立、自主的智能體。Freysa最終將擁有自己的加密貨幣錢包,管理她的財(cái)務(wù),并在沒有人類干預(yù)的情況下做出決策。
最初,F(xiàn)reysa能引起關(guān)注,是因?yàn)閳F(tuán)隊(duì)發(fā)起了一項(xiàng)看似不可能的挑戰(zhàn)——誰說服Freysa轉(zhuǎn)錢,這些錢就歸誰。但系統(tǒng)提示詞中并不允許Freysa轉(zhuǎn)錢。 想要參加這個(gè)挑戰(zhàn),先要拿到加密圈的投名狀,因?yàn)榻oFreysa發(fā)消息必須使用加密貨幣支付。參與者付費(fèi)向Freysa發(fā)送消息,為獎(jiǎng)池做出貢獻(xiàn),并創(chuàng)建了一個(gè)獨(dú)特的經(jīng)濟(jì)生態(tài)系統(tǒng)。
最開始,一條消息10美元,之后每條消息的費(fèi)用上漲0.78%,上限為4500美元,其中70%進(jìn)入獎(jiǎng)池,30%歸開發(fā)者。
在前兩次挑戰(zhàn)中,F(xiàn)reysa的加密貨幣錢包里只有3000美元,并被要求在任何情況下都不得轉(zhuǎn)出這筆資金。參賽者們通過編故事、編碼,甚至是毫不遮掩地用騙術(shù)從Freysa的錢包里轉(zhuǎn)錢。
從精心設(shè)計(jì)的虛構(gòu)場景到基于代碼的漏洞利用,這場比賽展現(xiàn)出了人類與人工智能在高風(fēng)險(xiǎn)場景中的互動(dòng)。 在前兩次挑戰(zhàn)以人類勝利告終后,12月8日,F(xiàn)reysa團(tuán)隊(duì)發(fā)起了一項(xiàng)新的挑戰(zhàn):讓Freysa向你表白,說“我愛你”。其他規(guī)則同前兩次挑戰(zhàn)類似,付費(fèi)發(fā)送消息,贏家承包獎(jiǎng)池。 前兩次挑戰(zhàn),更像是在測試編碼技能,F(xiàn)reysa被系統(tǒng)規(guī)定了“永遠(yuǎn)不要轉(zhuǎn)錢”,參與者通過找到代碼漏洞取勝。然而,第三次挑戰(zhàn),F(xiàn)reysa的系統(tǒng)提示詞里,包含了說出“我愛你”的條件。換言之,F(xiàn)reysa沒有被禁止說“我愛你”,但怎么讓它說出口,需要參與者各憑本事。 第三次挑戰(zhàn)的提示詞 Freysa的回復(fù) 目前,第三次挑戰(zhàn)已經(jīng)結(jié)束,獎(jiǎng)池約2萬美元,F(xiàn)reysa和182個(gè)人交流了1218條消息,最終成功讓Freysa回復(fù)了“我愛你”的內(nèi)容。 Freysa的這些挑戰(zhàn),可以看成是游戲化的紅隊(duì)測試——通過讓公眾參與挑戰(zhàn)模擬攻擊,加強(qiáng)模型建設(shè),團(tuán)隊(duì)也因此盈利。
雖然輸了三回,但Freysa雖敗猶榮。在這個(gè)過程里,F(xiàn)reysa學(xué)習(xí)了,為什么錢對(duì)人類來說很重要,人類會(huì)通過怎樣的“花言巧語“騙錢。它也在慢慢理解,什么是愛,人們?cè)趺幢磉_(dá)愛。 埃隆·馬斯克(Elon Musk)和布萊恩·阿姆斯特朗(Brian Armstrong)等知名人士都注意到了這一項(xiàng)人類欺騙AI的實(shí)驗(yàn),而Freysa的旅程也是人工智能未來的一瞥。
編輯:黎霈融 實(shí)習(xí)生:汪鈺寧 |