D-Think | 東遠科技-廣州東遠智能科技有限公司- › 首頁 ›資訊› 科技頭條 › 查看內(nèi)容

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

2024-4-20 08:12| 發(fā)布者: admin| 查看: 231| 評論: 0

摘要: 明敏蕭簫發(fā)自凹非寺量子位 | 公眾號 QbitAI科大訊飛版ChatGPT產(chǎn)品，提前交卷了！就在昨夜，訊飛驟然向開發(fā)者提供了內(nèi)測通道，取名為訊飛星火認知大模型對外開啟內(nèi)測。還有個神奇的英文名字Spark Desk，據(jù)說有“火 ...

明敏蕭簫發(fā)自凹非寺
量子位 | 公眾號 QbitAI

科大訊飛版ChatGPT產(chǎn)品，提前交卷了！

就在昨夜，訊飛驟然向開發(fā)者提供了內(nèi)測通道，取名為訊飛星火認知大模型對外開啟內(nèi)測。

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

還有個神奇的英文名字Spark Desk，據(jù)說有“火花桌面智能助手”的意思。

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

訊飛這波操作，多少有點“反向跳票”的意思，因為早在今年2月初，科大訊飛就被曝加緊開發(fā)中國版ChatGPT。隨后國內(nèi)大模型關(guān)注度陡增后，科大訊飛率先給出了deadline：5月6日上線產(chǎn)品。

萬萬沒想到，距離正式發(fā)布還有10天，他們毫無征兆地開啟了內(nèi)測邀請。

從目前已經(jīng)獲得內(nèi)測的網(wǎng)友評價來看，有一些人認為效果“超出預期”，但也有人反饋只是“中規(guī)中矩”。整體來看，表達效果不錯的反饋占多數(shù)。

獲得內(nèi)測資格的方式也有點意思，是AI打電話給確認的：

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

當然，科大訊飛大模型能力究竟如何，最好還是能實測后再說。

所以第一時間拿到內(nèi)測邀請的我們，也連夜完成了測試。詳情如下：

淺測訊飛大模型

登錄進去后，首先看到的是訊飛星火認知大模型的自我介紹：

我能學習和理解人類的語言，進行多輪對話、回答問題和高效地幫助人們獲取知識和靈感。

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

老樣子，還是從語文、數(shù)學、代碼和邏輯幾方面，測測訊飛星火認知大模型的綜合能力。

那么我們就先從語文能力測起。

考慮到現(xiàn)在弱智吧已經(jīng)成為ChatGPT時代下的Benchmark了，所以先測試大家想看的環(huán)節(jié)。

結(jié)合下科大訊飛的特點，我們拋給訊飛星火了一個地獄地域笑話。

沒想到，它是懂安徽人的。

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

△我們?nèi)チ藞D片ID水印，可能導致截圖文字不清楚（還望大家理解）

再來一個腦筋急轉(zhuǎn)彎試試。

訊飛星火的回答非常一本正經(jīng)：首先表示“玉皇大帝是否存在這個事情不是我AI可以下結(jié)論的”，這個問題驢唇不對馬嘴，玉皇大帝住哪的設(shè)定和現(xiàn)代科學沒有關(guān)系。

但你要非要我說點啥，我只能說或許玉皇大帝可能在地球上空吧。

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

不過這段回答里也有個小bug，即在東亞宗教信仰里天界包括天堂和神界（？）

實際上，在一些弱智吧問題里，訊飛星火的表現(xiàn)往往是懂了但沒完全懂。

比如它知道焚書坑儒的事，但是又解釋不清楚衍生出來的地獄笑話。

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

不過在基本語文能力上，訊飛星火的表現(xiàn)還是值得關(guān)注的。

比如給出第一句，補充寫一首魯迅風格的詩歌：

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

提的要求它都基本滿足了，不過紫菜湯為啥曾是漁民的希望？是我理解不了AI的深意了。

換成周杰倫的風格呢？

表現(xiàn)也還不錯，馬上替換了后三句的內(nèi)容。懷念童年也是周董歌里經(jīng)常出現(xiàn)的主題了。

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

古文中的對對子，它也能對仗比較工整，表達意思上也沒出什么問題。

我們給的上聯(lián)是：福慧雙修須及物。

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

再試試成語接龍：

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

如果它接錯了，提醒下能改正回來，也表現(xiàn)出了一定的多輪對話能力：

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

創(chuàng)作的洋蔥新聞，也確實有那感覺了~

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

續(xù)寫的恐怖故事也有點水平：

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

那么再看看數(shù)學能力？

基本的加減法、雞兔同籠應對起來都很輕松了。

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

不過在高數(shù)方面還是有點困難，讓它求解：f(x)=x(x-1)(x-2)(x-3),f’(0)=?

即便在我們提醒它算錯了情況下，修正起來也比較困難（正確答案為-6）。

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

OK，接下來就輪到代碼能力了。

我們給的要求是：幫我寫一個計算器程序。

確實完成了一個四則運算的簡單計算器，甚至還有命令行操作界面：

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

除了有一個小bug（函數(shù)外不能return）外，簡單修改后可以運行。

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測

另外對于Python縮進的空格與tab之爭，這只AI是個空格黨。

這里貼上代碼塊，大伙兒可以試試：

#coding=utf-8#量子位注：AI沒生成這句，根據(jù)不同運行環(huán)境可能需要加一下# 定義函數(shù)，實現(xiàn)加法運算def add(x, y):    return x + y# 定義函數(shù)，實現(xiàn)減法運算def subtract(x, y):    return x - y# 定義函數(shù)，實現(xiàn)乘法運算def multiply(x, y):    return x * y# 定義函數(shù)，實現(xiàn)除法運算def divide(x, y):    if y == 0:        print("除數(shù)不能為零！")        return    else:        return x / y# 主程序print("歡迎使用計算器！請選擇需要進行的操作：")print("1. 加法")print("2. 減法")print("3. 乘法")print("4. 除法")choice = input("請輸入操作編號(1/2/3/4)：")num1 = float(input("請輸入第一個數(shù)字："))num2 = float(input("請輸入第二個數(shù)字："))if choice == '1':    print(num1, "+", num2, "=", add(num1, num2))elif choice == '2':    print(num1, "-", num2, "=", subtract(num1, num2))elif choice == '3':    print(num1, "*", num2, "=", multiply(num1, num2))elif choice == '4':    if num2 == 0:        print("除數(shù)不能為零！")        # return （量子位注：這里有bug，注釋掉就可）    else:        print(num1, "/", num2, "=", divide(num1, num2))else:    print("非法輸入！")

生成表格能力也是有的，同時可以按照要求修改表格：

訊飛版ChatGPT突然開始內(nèi)測！我們連夜一手實測