潮新聞客戶端 記者 何泠瑤 OpenAI又迎來升級,搖身一變成了人工智能語音助手。 北京時間周二凌晨1點, 人工智能(AI)巨頭OpenAI舉行春季發(fā)布會。公司首席技術(shù)官Mira Murati帶來了多項與ChatGPT有關(guān)的更新。 發(fā)布會截圖 正如前幾天, CEO山姆·奧特曼(Sam Altman)在一檔播客中預告的一樣,OpenAI將改進并提升ChatGPT的語音功能質(zhì)量,并表示相信語音交互是通向未來交互方式的一個重要途徑。 奧特曼稱:“多模態(tài)交互能力非常強大,比如可以問:‘嘿,ChatGPT,我正在看什么’或‘我不太確定這是哪種植物。’” “我期望的是一種始終處于激活狀態(tài),且極易使用的設(shè)備,可以通過語音、文字,或者更理想的其他狀態(tài),來理解我的需求?!眾W特曼表示,“設(shè)想有個系統(tǒng)能全天輔助我,盡可能多地去收集上下文信息,成為世界上最出色的助理,不斷地幫助我提升自我?!?br> OpenAI的發(fā)布會上,Mira Murati發(fā)布最新GPT-4o多模態(tài)大模型,相較于上一代GPT-4 Trubo,速度更快、價格也更便宜。 通過響應速度的大幅提升,該模型在語音模式下,已經(jīng)可以達到“實時”響應的狀態(tài),不再需要尷尬地等上幾秒鐘,等ChatGPT給出一個回答。 換句話說,用戶可以與ChatGPT像真人一樣聊天——在機器人回應的過程中打斷它,提出更多的要求(例如轉(zhuǎn)變話題、要求機器人改變語音語調(diào)),再也不需要等待機器人完成上一個問題的回復后,再提出新的問題。 發(fā)布會上,主持人與ChatGPT寒暄幾句,它能夠從對方的喘氣聲中理解“緊張”的含義,并且指導他進行深呼吸。 隨后,主持人開了攝像頭,拍了白紙上一道題目,請ChatGPT實時幫忙解一個一元方程題,又解讀了一幅氣溫圖表。除了圖像識別和解題能力外,ChatGPT展現(xiàn)了實時根據(jù)影像變化,與人們實時互動的能力。 發(fā)布會截圖 主持人還展示了和ChatGPT進行意大利語、英語的對話聊天,ChatGPT毫不費力地就能充當兩人的現(xiàn)場翻譯員,實時準確地翻譯出對話內(nèi)容。 發(fā)布會截圖 此外,OpenAI宣布,ChatGPT的免費用戶也能用上最新發(fā)布的GPT-4o模型(更新前只能使用GPT-3.5),來進行數(shù)據(jù)分析、圖像分析、互聯(lián)網(wǎng)搜索、訪問應用商店等操作。這也意味著GPT應用商店的開發(fā)者,將面對海量的新增用戶。 當然,付費用戶將會獲得更高的消息限制,至少是免費用戶的5倍。當免費用戶用完消息數(shù)量后,ChatGPT將自動切換到 GPT-3.5。另外,OpenAI將在未來1個月左右向Plus用戶推出基于GPT-4o改進的語音體驗,目前GPT-4o的API并不包含語音功能。 發(fā)布會截圖 最后,蘋果電腦用戶將迎來一款為macOS設(shè)計的ChatGPT桌面應用,用戶可以通過快捷鍵“拍攝”桌面并向ChatGP提問,OpenAI表示,Windows版本將在今年晚些時候推出。 OpenAI 還表示,ChatGPT 還優(yōu)化了用戶界面,有了全新的界面。OpenAI 的演示顯示,用戶可以將處于最小化窗口的 ChatGPT 桌面應用與其他程序并排打開。用戶可以通過輸入或語音的方式向 ChatGPT 提問屏幕上顯示的內(nèi)容,ChatGPT 則能根據(jù)其“所見” 進行回答。 對于蘋果用戶,人們可以通過 Option + 空格鍵向 ChatGPT 提問,并且可以在應用內(nèi)截取和討論屏幕截圖。 “轉(zhuǎn)載請注明出處” |
19款電子扎帶
電路板識別電子標簽