自從 ChatGPT 橫空出世,AI 的熱潮已經(jīng)席卷了兩年。這兩年,普通人對大語言模型的能力興奮,隨便一條指令就能生成流暢自然的文本,科幻電影里的場景,如今早已經(jīng)成為現(xiàn)實(shí)。 大模型這個賽道也開始進(jìn)入到一個十字路口,新技術(shù)如何轉(zhuǎn)化為新產(chǎn)品,滿足真需求,發(fā)展成新的商業(yè)生態(tài)。 如同移動支付、智能手機(jī)、 LTE 共同點(diǎn)燃了移動互聯(lián)網(wǎng)時代的繁盛,AI 行業(yè)這一年也在尋找這樣的 PMF(Product Market Fit)而焦慮。 新技術(shù)的大航海時代已經(jīng)開啟,到底能不能發(fā)現(xiàn)新大陸,這將決定大模型是不是又一個燒錢的資本游戲,是 .com 泡沫的加速重演,還是如黃仁勛所言的新工業(yè)革命開端,這個答案會比 AGI 更快讓我們看到 。 大模型的大問題今天,基座模型的競爭基本已經(jīng)形成穩(wěn)定的格局。由 OpenAI 領(lǐng)銜,旗下的 ChatGPT 也是穩(wěn)居市場龍頭。Anthropic,DeepMind,Llama,Grok,也各有各的長處。 于是,今年最熱鬧的,不是誰又多擴(kuò)充了多少參數(shù)、響應(yīng)速度提高了多少秒,而是大模型技術(shù)怎么化身為一個能用的產(chǎn)品。 大語言模型的技術(shù)怎么落地,從一開始就是個抓肝撓心的問題。哈佛商業(yè)評論曾經(jīng)做過一個調(diào)查,發(fā)現(xiàn)生成式 AI 的應(yīng)用——種類之繁雜,多達(dá) 100 類。 不過,在大類上就是五種:技術(shù)問題解決、內(nèi)容生產(chǎn)及編輯、客戶支持、學(xué)習(xí)和教育、藝術(shù)創(chuàng)作和調(diào)查研究。 知名的投資公司 a16z,給出了他們團(tuán)隊(duì)心中優(yōu)秀的生成式 AI 產(chǎn)品,其中有不少眼熟的,比如通用類的 Perplexity,Claude,ChatGPT。也有更為垂直的,比如筆記類產(chǎn)品 Granola, Wispr Flow,Every Inc.,Cubby 等。還有教育賽道今年最大贏家 NotebookLM,或者是聊天機(jī)器人 Character.ai,Replika 等。 繁花錦繡是對于普通用戶來說的:上面這些產(chǎn)品,絕大多數(shù)只是免費(fèi)就足夠用了,訂閱版或 pro 版的費(fèi)用,不是必須花的錢。強(qiáng)如ChatGPT,今年的訂閱收入大概在每月 2.83 億美元,與去年相比增長了兩倍。但在巨大的成本面前,這點(diǎn)收入顯得杯水車薪。 享受科技發(fā)展屬于普通用戶的開心事,烈火烹油是留給從業(yè)者的:再怎么激動人心的技術(shù)進(jìn)化,也不能停留在實(shí)驗(yàn)室里,而是要進(jìn)入商業(yè)社會接受檢驗(yàn)。訂閱模式?jīng)]有被廣泛接受,植入廣告的時機(jī)還沒有到來。留給大模型空燒錢的時間,已經(jīng)很少了。 相比之下,toB 業(yè)務(wù)的走勢讓人有信心的多。 自 2018 年以來,財富 500 強(qiáng)財報電話會議中提及 AI 的次數(shù)幾乎翻了一番。在所有財報電話會議中,19.7% 的記錄提到最多的主題,就是生成式人工智能。 這也是整個行業(yè)的共識。根據(jù)中國信通院發(fā)布的《人工智能發(fā)展報告(2024 年)》藍(lán)皮書,2026 年,超過 80%的企業(yè)將使用生成式人工智能 API,或者部署生成式的應(yīng)用。 面向企業(yè)側(cè)和消費(fèi)側(cè)的應(yīng)用展現(xiàn)出不同的發(fā)展態(tài)勢:面向消費(fèi)側(cè),大模型應(yīng)用講究低門檻、創(chuàng)意性。而面向企業(yè)側(cè),大模型應(yīng)用更注重專業(yè)定制和效益反饋。 換句話說,提升效益當(dāng)然是每個企業(yè)都在追求、都想實(shí)現(xiàn)的,但只有這四個字太模糊了。大模型需要證明自己能實(shí)實(shí)在在地解決使用場景中的問題,真真切切地提升效益。 精準(zhǔn)找到切角,讓技術(shù)降落無論是資源的投入,還是對開拓市場的力度,國內(nèi)的大模型競爭,在整個 2024 年稱得上激烈。 根據(jù)工信部數(shù)據(jù),2023 年中國大語言模型市場規(guī)模增長率突破 100%,市場規(guī)模達(dá)到 147 億元。各家廠商在商業(yè)化進(jìn)程上積極嘗試,首先打響的是價格戰(zhàn):以 tokens 計費(fèi)、API 調(diào)用等方式的成本,正在被不斷拉低。許多主流熱門通用類大模型的價格,離白用已經(jīng)沒多遠(yuǎn)。 把價格打下、降低成本是更好實(shí)現(xiàn)的。而理解業(yè)務(wù)、分析切入場景,是一條更崎嶇的路線。 不過,也不是每一家都在參與價格戰(zhàn),靠低價硬卷。 「在這種情況下,更重要的是找到我們的特點(diǎn),發(fā)揮我們的優(yōu)勢。騰訊內(nèi)部本身有很多場景,這些場景給了我們更多洞察,也進(jìn)一步打磨了我們的能力」騰訊云智能 AI 產(chǎn)品專家、騰訊混元 ToB 產(chǎn)品負(fù)責(zé)人趙新宇這樣認(rèn)為,「往外看,聚焦一個行業(yè),聚焦在這個行業(yè)內(nèi)一些特定的場景,再慢慢拓展出去?!?br> 在眾多基座模型中,混元可能不是熱度最高的一個,可在技術(shù)實(shí)力上卻不容忽視。 九月時,混元發(fā)布的通用文生文模型混元 Turbo,采用全新的混合專家模型(MoE)結(jié)構(gòu)。從語言理解和生成、邏輯推理、意圖識別,到編碼、長上下文和聚合任務(wù)中,都有相當(dāng)強(qiáng)大的表現(xiàn)。在 11 月的動態(tài)更新版本中,已經(jīng)升級為全系列效果最好的模型。目前,騰訊混元的能力正在通過騰訊云全面輸出,通過提供多尺寸、多類型的模型,結(jié)合騰訊云智能其他的AI產(chǎn)品和能力,幫助模型應(yīng)用落地到場景中。 縱觀目前模型應(yīng)用落地形態(tài),大致分為兩種:嚴(yán)肅場景和娛樂場景。后者類似于聊天機(jī)器人、陪伴類應(yīng)用等等。 而「嚴(yán)肅場景」,則指向企業(yè)核心業(yè)務(wù)運(yùn)營中,對準(zhǔn)確性和可靠性要求較高的應(yīng)用場景。在這些場景中,大模型要承擔(dān)結(jié)構(gòu)化的信息處理,往往需要遵循預(yù)設(shè)的業(yè)務(wù)流程和質(zhì)量標(biāo)準(zhǔn),其應(yīng)用效果,會直接關(guān)系到企業(yè)的運(yùn)營效率和業(yè)務(wù)成果。 騰訊云曾經(jīng)幫助一家外呼服務(wù)商構(gòu)建客服體系,這是一個典型的嚴(yán)肅類場景。同時,外呼涉及到自然語言對話能力、內(nèi)容理解和分析能力,看上去天然和大語言模型有極高的適配。 實(shí)際上,挑戰(zhàn)都在細(xì)節(jié)之處。當(dāng)時團(tuán)隊(duì)面臨核心挑戰(zhàn)有兩個。一是性能問題,由于模型參數(shù)量巨大,達(dá)到 70B 或 300B 規(guī)模,如何在500毫秒內(nèi)完成響應(yīng),并傳遞給下游 TTS 系統(tǒng)成為一個重要的技術(shù)難題。 二則是對話邏輯的準(zhǔn)確程度。模型會在在一些對話中出現(xiàn)不合邏輯的回復(fù),影響整體對話效果。為了克服這些挑戰(zhàn),項(xiàng)目團(tuán)隊(duì)采取了密集迭代的策略,在 1-2 個月的開發(fā)周期內(nèi),保持每周一個版本的快速迭代節(jié)奏。 企業(yè)客戶對大語言模型技術(shù)展現(xiàn)出興趣,并愿意進(jìn)行創(chuàng)新嘗試,但在技術(shù)與業(yè)務(wù)的深度融合方面,始終存在認(rèn)知鴻溝。這并非源于企業(yè)對自身業(yè)務(wù)理解的不足,而是需要一個專業(yè)的技術(shù)團(tuán)隊(duì),通過深入理解行業(yè)痛點(diǎn)和業(yè)務(wù)場景,找到最恰切的場景,為企業(yè)量身打造 AI 落地的方案,實(shí)現(xiàn)技術(shù)與業(yè)務(wù)的最優(yōu)契合。 「傳統(tǒng)的做法可能需要運(yùn)營人員一個場景一個場景地搭建(語料庫),」新宇介紹到,「而大模型,你只需要給一個 prompt,就可以實(shí)現(xiàn)需求了?!乖诿宄枨蠛螅煸膱F(tuán)隊(duì)幾乎每周一個版本更新,「卷」起了迭代速度,一兩個月下來,準(zhǔn)確度已經(jīng)達(dá)到了 95%。 對于這家外呼服務(wù)商,生成式技術(shù)完全是新鮮事物。而混元直接讓他們看到了大模型所帶來的效益,在人力方面的開支減少了四分之三。 「最好的做法就是把效果拿出來,」新宇說,當(dāng)客戶對生成式技術(shù)的了解有一點(diǎn),但不多的時候,把效果擺出來是最有效的。通過客戶的業(yè)務(wù)經(jīng)歷,找到可以切入的場景,直接去做測試驗(yàn)證,展示出可以提升的效果。 類似的經(jīng)歷,在體現(xiàn)和小米的合作中,這是一次被稱為「雙向奔赴」的合作。 對方希望在問答互動中引入大模型,把AI搜索的能力應(yīng)用到端側(cè)。這踩中了混元的兩個長處:一是由騰訊豐富的內(nèi)容生態(tài)所提供的支持;二是混元在 AI 搜索方面的能力。對于問答來說,準(zhǔn)確率非常關(guān)鍵。 「一開始還是有很多困難的,」新宇回顧道,「從他們的角度來看,業(yè)務(wù)形態(tài)涵蓋了多個場景,包括閑聊、知識問答等不同類型,其中知識問答場景,對準(zhǔn)確率有比較高要求。」 通過前期的測試,混元團(tuán)隊(duì)明確了自己在搜索場景中的優(yōu)勢,雙方一起將廣泛意義上的問答互動,按照不同的話題層級逐步細(xì)化。這樣的細(xì)分,能夠讓模型更清晰地了解各個場景的具體需求和效果要求,從而進(jìn)行更有針對性的優(yōu)化。 知識問答場景,成了那個降落點(diǎn)。在后續(xù)的實(shí)現(xiàn)上,混元需要攻克的挑戰(zhàn)仍不少:時延問題不必多說,響應(yīng)時間一定要快;其次是對搜索內(nèi)容的整合。 「在整個鏈路當(dāng)中,我們做了自建搜索引擎,還有一個意圖分類模型,來判斷是不是一個高時效性的提問。比如是不是跟新聞、時事相關(guān)的話題,然后再判斷是該給到主模型還是 AI 搜索?!?br> 只調(diào)用最需要的部分,這樣一來響應(yīng)速度能夠大大提升。而一個重要的發(fā)現(xiàn)是, 70% 的問詢都會引到 AI 搜索上,這意味著必須要有足夠豐富的內(nèi)容,作為最基礎(chǔ)的調(diào)用支撐。 而混元背后,站著的是整個騰訊的內(nèi)容生態(tài)。從新聞、音樂、金融,甚至醫(yī)療等更具體的領(lǐng)域,都能在騰訊的生態(tài)里找到海量的優(yōu)質(zhì)內(nèi)容。這些都是混元模型在搜索時,可以觸達(dá)和引用的數(shù)據(jù),也是獨(dú)一無二的壁壘。 經(jīng)過歷時兩個多月的高強(qiáng)度迭代,最終無論是回答的質(zhì)量、響應(yīng)和性能等方面,都完全實(shí)現(xiàn)了需求,上線到了小米的實(shí)際業(yè)務(wù)中。 toB 業(yè)務(wù)的要義便在于此,能夠?qū)崿F(xiàn)營收、能夠贏得信任,需要實(shí)實(shí)在在給客戶的業(yè)務(wù)帶來價值。 「卷」泛化,才能走向更多場景大模型在不同行業(yè)和產(chǎn)品的落地中,實(shí)際上也在促進(jìn)技術(shù)自身的成長。 對于一部分大模型產(chǎn)品而言,選擇 toC 的路徑有一個核心考量:用 C 端的反饋來優(yōu)化模型。大模型對調(diào)優(yōu)的需求沒有盡頭,而 C 端消費(fèi)群的數(shù)量和活躍度,為模型的迭代提供了養(yǎng)料。這樣一來,迭代的飛輪就能跑起來。 實(shí)際上,這在 toB 業(yè)務(wù)中也會實(shí)現(xiàn),甚至要求更高。 「少年得到」的 K12 語文作文批改功能,應(yīng)用了混元的多模態(tài)能力。結(jié)合騰訊云智能的 OCR 技術(shù),識別學(xué)生的作文內(nèi)容,并根據(jù)設(shè)置好的評分標(biāo)準(zhǔn),由大模型為作文打分。 通常,大模型和真人教師判分,差值在五分內(nèi)就很好了——可這并不容易實(shí)現(xiàn)。一開始混元的評分和真人教師的評分,差值小于五分的情況,只有 80%。 「模型有一定方法和能力,能夠解決一些場景里的問題。但是聚焦到一個具體客戶的業(yè)務(wù)上,對這個效果有更高的要求?!剐掠钫f,「可能 90%的準(zhǔn)確度可以達(dá)成業(yè)務(wù)目標(biāo),但只有 70% 和 80% 的時候,就有一定距離?!? 這意味著還要繼續(xù)「卷」下去。隨著服務(wù)企業(yè)客戶群體的不斷擴(kuò)大,對技術(shù)本身也提出了新要求:首先是迭代速度的大幅提升——面向 C 端用戶時,迭代可能需要一到兩個月。而現(xiàn)在,每周都能出現(xiàn)一個版本,這種高頻迭代節(jié)奏極大促進(jìn)了模型的成長和進(jìn)步。 其次,通過持續(xù)服務(wù)不同企業(yè)場景,也顯著增強(qiáng)了模型的泛化能力。這表明,深入服務(wù)多元化的企業(yè)需求不僅加快了模型開發(fā)迭代的節(jié)奏,也提高了模型的實(shí)用性和適應(yīng)性,可以從嚴(yán)肅場景,拓展到偏娛樂向的場景中。 剛剛獲得千萬級 A 輪融資的角色扮演內(nèi)容平臺「造夢次元」,應(yīng)用到了混元大模型的角色扮演專屬模型Hunyuan-role,定位于服務(wù)年輕用戶,結(jié)合生成式 AI 技術(shù),提供交互式、劇情化的虛擬角色互動體驗(yàn)。 Hunyuan-role 開創(chuàng)了一種全新的人機(jī)交互方式。通過塑造豐富多樣的虛擬角色形象,并基于預(yù)設(shè)的劇情背景和人物設(shè)定,與用戶展開自然流暢的互動對話。 在技術(shù)層面,這樣的場景應(yīng)用到了 Hunyuan-role 在長短文本對話處理、意圖識別和響應(yīng)等方面都展現(xiàn)出領(lǐng)先優(yōu)勢,能夠勝任多樣化的應(yīng)用場景,并且展現(xiàn)出了出色的內(nèi)容擬人化能力——不僅能夠進(jìn)行有溫度的對話互動,還可以推進(jìn)故事情節(jié)發(fā)展,營造沉浸式的用戶體驗(yàn)。 這些特性使得 Hunyuan-role 成為產(chǎn)品獲客和用戶運(yùn)營的有力工具,在提升用戶留存率和使用粘性方面發(fā)揮著重要作用。同樣也反映出,在嚴(yán)肅場景得到鍛煉和提升的混元,從而形成的泛化能力,可以覆蓋到更廣闊的場景,乃至在端側(cè)的應(yīng)用。 從嚴(yán)肅場景,逐步擴(kuò)展到娛樂、創(chuàng)意,乃至更多的場景,是大模型應(yīng)用必須走上的征程。 隨著技術(shù)的成熟和成本的降低,大模型勢必要向更廣泛的應(yīng)用場景擴(kuò)展。原先聚焦于嚴(yán)肅的商業(yè)場景,如企業(yè)辦公、數(shù)據(jù)分析、科研等行業(yè),因?yàn)檫@些場景具有明確的需求和較高的支付意愿。 進(jìn)一步拓展到娛樂、創(chuàng)意、內(nèi)容生產(chǎn)等行當(dāng)中,需要在思路上有一個錨點(diǎn):始終以解決具體場景中的需求點(diǎn)為核心目標(biāo),錨定融合大模型能力的切入點(diǎn)。 除了與應(yīng)用軟件的合作,也需要有和硬件廠商的合作,讓模型在最靠近消費(fèi)者的端側(cè)有所施展與發(fā)揮,提供更貼近用戶的日常生活,提供更便捷、即時的服務(wù)體驗(yàn)。 這個過程中,市場對生成式 AI 技術(shù)的認(rèn)知和接受度在不斷提高,用戶基數(shù)也在持續(xù)擴(kuò)大。面對這種快速變化的市場環(huán)境,模型的迭代能力變得尤為重要。這不僅體現(xiàn)在技術(shù)性能上,還包括對用戶需求的理解、對不同場景的適應(yīng)性等多個維度。只有那些能夠快速學(xué)習(xí)、持續(xù)優(yōu)化、不斷適應(yīng)新需求的模型和團(tuán)隊(duì),才能在競爭中保持優(yōu)勢。 在不斷覆蓋更多場景的時候,也是在走向更多的終端消費(fèi)者。隨著市場整體對生成式技術(shù)的接受,潛在用戶量會持續(xù)增加,一個能夠快速迭代和自我提升的模型,才可以敏銳地適應(yīng)變化,走得更穩(wěn)、更遠(yuǎn)。 #歡迎關(guān)注愛范兒官方微信公眾號:愛范兒(微信號:ifanr),更多精彩內(nèi)容第一時間為您奉上。 愛范兒|原文鏈接· ·新浪微博 |
19款電子扎帶
電路板識別電子標(biāo)簽