圖片系A(chǔ)I生成 全球大模型的發(fā)展猶如大江奔流,局部掀起一朵浪花很快就被潮涌覆蓋。 2025年開局已經(jīng)傳遞出一種焦慮:零一萬物退出超級大模型訓(xùn)練場景,轉(zhuǎn)型考慮商業(yè)化可能性。Kimi背后公司陷入股權(quán)紛爭。國內(nèi)AI“六小虎”從百模大戰(zhàn)中突圍后,不得不再次面臨新的拐點。更早前,OpenAI轉(zhuǎn)型盈利方向,出現(xiàn)核心人員集中離職;而本身就是OpenAI離職高管創(chuàng)辦的Anthropic連續(xù)獲得亞馬遜和谷歌大手筆注資…… 大模型終究是少數(shù)人的競技場。這一過程會大浪淘沙,讓從業(yè)者逐漸找準(zhǔn)各自的市場位置,提升資源消耗和技術(shù)的產(chǎn)出價值。那些在公共云時代依靠自研積累起技術(shù)寶藏的公司,那些有全棧創(chuàng)新思維的公司,將在新時期贏得先發(fā)先機。這一預(yù)判也得到IDC研究機構(gòu)的認(rèn)可:過往在AI+云計算領(lǐng)域有雙向積累的公司正在獲得先發(fā)優(yōu)勢。AI時代對云有了新要求,“AI云”應(yīng)運而生。 AI云不是新事物,而是一種技術(shù)沉淀與戰(zhàn)略思維,也預(yù)示AI未來趨勢。2024年,阿里云在全球云計算3A格局中取得了多項重要技術(shù)突破。過去一年正是它在AI云戰(zhàn)略視角下對大模型、AI應(yīng)用開發(fā)、AI基礎(chǔ)設(shè)施領(lǐng)域集中迭代升級的時期。從當(dāng)年寫下第一行飛天代碼就一直堅持自研創(chuàng)新的這家公司,將迎來AI的“飛天”時刻。 燎原之勢后的大模型2024年第三季度末,通義開源模型超過美國Meta公司的Llama,成為世界第一模型群,當(dāng)時其原生模型和衍生模型總數(shù)超過7.4萬個。由于衍生模型是在原生數(shù)據(jù)模型基礎(chǔ)上為匹配特定場景所做的調(diào)整,衍生模型規(guī)模從一定程度上能反映大模型對于開發(fā)者的受歡迎程度和應(yīng)用價值,這也是對阿里云堅持開源的最好回應(yīng)。 在大模型風(fēng)靡全球的這兩年,行業(yè)中存在兩條涇渭分明的路線,一條是閉源路線,一條是開源路線,阿里云是國內(nèi)大模型開源路線的絕對信徒,在2023年8月在國內(nèi)率先加入開源行列后,便沿著全尺寸、全模態(tài)方向陸續(xù)推出了多款開源大模型。 與此同時,2023年云棲大會上釋放的一個明確信號就是“打造AI時代最開放的云”。阿里云堅信不開放沒有生態(tài),沒有生態(tài)就沒有未來。 事實上,通過降低大模型使用門檻,吸引更多開發(fā)者和企業(yè)用戶一起參與和促進(jìn)技術(shù)產(chǎn)品的迭代升級、推動創(chuàng)新效率提升、發(fā)現(xiàn)并解決新技術(shù)的問題,最終實現(xiàn)技術(shù)落地,構(gòu)建大模型的繁榮生態(tài),更好滿足市場靈活化和定制化的需求。這一預(yù)判也在當(dāng)前企業(yè)使用多個模型組合應(yīng)用的趨勢上得到印證。 與此同時,也只有站在更先進(jìn)更穩(wěn)定的技術(shù)能力之上,才有開放的底氣。通義開源模型不斷進(jìn)取迭代,僅2024年一年就實現(xiàn)了三次重要更新。 2024年2月,Qwen1.5開源了包括6種不同規(guī)模的Base和Chat模型,并在多項基準(zhǔn)測試中展示了卓越的語言理解、推理能力及多語言處理性能,尤其在長序列支持和人類偏好對齊方面取得了顯著進(jìn)步。隨后,4月份又開源了首個千億級大模型Qwen1.5-110B。 6月,Qwen2發(fā)布,包含5個尺寸的預(yù)訓(xùn)練和指令微調(diào)模型。全球著名開源平臺Hugging Face的CEO Clem曾在社交平臺上將通義QWen2-72B視為“王者”,中國在開源模型中具備統(tǒng)領(lǐng)地位。這是他去年6月份使用300塊H100芯片對全球100多個主流開源大模型進(jìn)行評估后得出的排名。 9月,在2024年云棲大會上,阿里云發(fā)布了更為強大的Qwen2.5系列,該系列覆蓋了從0.5B到72B的不同參數(shù)規(guī)模的語言模型,可適應(yīng)不同復(fù)雜度的任務(wù)及應(yīng)用場景需求;并推出了針對編程的Qwen2.5-Coder和針對數(shù)學(xué)的Qwen2.5-Math模型。其中旗艦?zāi)P蚎wen2.5-72B性能超越Lama 405B。 同樣在云棲大會上,通義萬相也迎來升級,發(fā)布了全新的視頻生成模型,可生成影視級高清視頻。繼文生文和文生圖后,文生視頻、圖生視頻的需求增多,在影視制作、動畫設(shè)計、廣告設(shè)計領(lǐng)域的應(yīng)用擴大了AI生產(chǎn)力的范圍。在最新的升級中,通義萬相2.1視頻生成模型解決了在復(fù)雜物理場景中肢體運動扭曲的難題,即便是游泳、花樣滑冰、跳水等運動視頻里也能保持肢體協(xié)調(diào)。 阿里云通過全尺寸、多模態(tài)的模型家族提供的靈活性,進(jìn)一步豐富了模型落地場景。一方面,千億級參數(shù)的模型能盡可能提升模型能力的天花板,另一方面小參數(shù)的模型,諸如Qwen-1.8B可以補足智能終端落地的諸多場景,為以大訓(xùn)小,端云協(xié)同提供更多可能。 在剛剛結(jié)束的2025 CES(國際消費電子展)上可以看到,包括AI伴侶、AI耳機、AI眼鏡、AI手杖、AI投籃機等AI硬件新物種百花齊放,各類應(yīng)用場景的機器人產(chǎn)品也是一大亮點,車企及產(chǎn)業(yè)鏈公司在智駕前沿技術(shù)上也大秀肌肉。 AI給終端設(shè)備帶來全新想象空間,也面臨諸多挑戰(zhàn)。邊緣智能場景下,從端側(cè)發(fā)起的AI模型調(diào)用需求越來越多,但端側(cè)設(shè)備在算力、功耗、成本上不具備優(yōu)勢,就迫使業(yè)界將模型小型化、蒸餾模型,并催生邊緣智能體、云+端協(xié)同的演進(jìn)。 過去一年,通義大模型基于端云架構(gòu)已服務(wù)汽車、手機、PC、電視、教育硬件、穿戴硬件等千行百態(tài)智能終端,實現(xiàn)AI能力進(jìn)化。在這背后,是通義提供大模型端云架構(gòu),通過異構(gòu)算力適配、多源模型供給、端云平臺協(xié)同、全鏈路安全保障,全面支撐千行百態(tài)智能終端各類AI應(yīng)用。 近日,雷鳥創(chuàng)新正式發(fā)布雷鳥V3 AI拍攝眼鏡。這款新品上搭載了其與阿里云通義共同打造的業(yè)內(nèi)首個專門面向智能眼鏡的AI大模型。這是國內(nèi)首個大模型與AR眼鏡硬件廠商開展的深度定制合作。基于通義系列大模型底座,雙方設(shè)計了整體多模態(tài)交互架構(gòu),定制化開發(fā)“云+端”模型,幫助產(chǎn)品實現(xiàn)高響應(yīng)、低延遲、高質(zhì)量的多模態(tài)AI交互體驗。 這些硬件智能場景常常需要將推理請求轉(zhuǎn)發(fā)到終端設(shè)備之外進(jìn)行,對推理能力本身和云端協(xié)同通信提出更高要求。2024年11月,阿里云通義團隊發(fā)布全新AI推理模型QwQ-32B-Preview, 并同步開源,在百煉、Hugging Face等平臺可用。據(jù)評測數(shù)據(jù)顯示,預(yù)覽版本的QwQ已展現(xiàn)出研究生水平的科學(xué)推理能力,它在數(shù)學(xué)和編程方面表現(xiàn)尤為出色,在國外社交媒體上贏得業(yè)內(nèi)贊譽。這是阿里云首個開源的AI推理模型。 回顧大模型領(lǐng)域兩年來的發(fā)展,通義千問不是最早的,卻在能力上后來居上。從2023年第二季度對外揭曉,隨即接入釘釘觸達(dá)用戶,到第三季度正式上線,并在隨后快速完成多模態(tài)產(chǎn)品布局。 據(jù)公開數(shù)據(jù)顯示,目前通義大模型已接入30萬企業(yè)客戶,包括中國一汽、三得利(中國)、攜程、喜馬拉雅、微博、聯(lián)想等知名企業(yè)。在互聯(lián)網(wǎng)客戶之外,工業(yè)生產(chǎn)領(lǐng)域?qū)νx大模型的需求增加是一個亮點。其中,傳統(tǒng)企業(yè)對于通義靈碼的依賴性在增強。 自上線一年來,通義靈碼已累計為程序員生成超10億行代碼,也使得阿里云成為目前唯一進(jìn)入AI代碼助理魔力象限中 “挑戰(zhàn)者”象限的中國科技企業(yè)。1月,通義靈碼正式發(fā)布AI程序員,成為全球首個同時支持VS Code、JetBrains IDEs開發(fā)工具的AI程序員。 回看通義大模型一路迭代,技術(shù)創(chuàng)新和規(guī)模效應(yīng)主導(dǎo)了這一過程,堅持開源開放、全尺寸多模態(tài)、AI工程化的方向讓通義千問在全球大模型中脫穎而出。 向AI原生時代遷躍如文章開頭所述,零一萬物將與阿里一起成立“產(chǎn)業(yè)大模型聯(lián)合實驗室”,并將涉及相關(guān)人員劃撥。此前的資金鏈緊張、被大廠收購等一系列傳聞已被該公司創(chuàng)始人站出來澄清。 這不僅反映出大模型初創(chuàng)公司的整體處境與審時度勢,也說明生成式AI市場需求的務(wù)實特點,一味卷大模型、消耗大量資源最終還是要回歸到用戶需求和成本收益綜合考量上。一線云廠商也紛紛在開發(fā)應(yīng)用平臺層面開展了軍備競賽。 2024年5月,阿里云百煉2.0發(fā)布,從模型開發(fā)、應(yīng)用開發(fā)到算力底座全面升級?!爱?dāng)下企業(yè)應(yīng)用大模型存在三種范式:一是對大模型開箱即用,二是對大模型進(jìn)行微調(diào)和持續(xù)訓(xùn)練,三是基于模型開發(fā)應(yīng)用,其中最典型的需求是RAG,以企業(yè)數(shù)據(jù)對大模型進(jìn)行知識增強。圍繞這些需求,百煉打造了模型中心和應(yīng)用中心,提供最豐富的模型和最易用的工具箱?!卑⒗镌浦悄芗瘓F首席技術(shù)官周靖人介紹。例如,針對當(dāng)下企業(yè)最關(guān)注的RAG鏈路,百煉提供靈活開放的企業(yè)級檢索增強服務(wù),5到10行代碼即可搭建RAG應(yīng)用,讓大模型擁有“最強外掛”。 在亞馬遜AWS最大的年度峰會上,有關(guān)AI應(yīng)用開發(fā)托管平臺Amazon Bedrock的動態(tài)已連續(xù)兩屆成為大會上最受關(guān)注的焦點,風(fēng)頭和戲份甚至蓋過了基礎(chǔ)模型和自研推理芯片等發(fā)布。這說明,全球廠商已深刻意識到,隨著生成式AI逐漸改變越來越多企業(yè)業(yè)務(wù),推理將成為每個應(yīng)用的核心部分,客戶開發(fā)者迫切需要平臺釋放更多便捷的功能,平臺能力受到市場檢驗。 比如模型幻覺是全球廠商目前著力解決的問題一環(huán)。所謂模型幻覺是模型生成的內(nèi)容與現(xiàn)實世界事實或用戶輸入不一致、甚至誤導(dǎo)性傾向的現(xiàn)象,大多產(chǎn)生在原始數(shù)據(jù)、模型訓(xùn)練、推理流程中。模型幻覺是整個行業(yè)面臨的一個根本挑戰(zhàn),特別是在金融、政務(wù)、醫(yī)療等強監(jiān)管行業(yè)中,會限制客戶對生成式AI的信任。對此,流程上的監(jiān)測、自動化檢查等措施被引入平臺。 阿里云此前已實現(xiàn)AI應(yīng)用鏈路全??捎^測,業(yè)內(nèi)領(lǐng)先的多層級Trace體系具備完善的監(jiān)控告警機制。全新AI原生全棧可觀測平臺首次實現(xiàn)了云上AI大模型從訓(xùn)練到推理再到應(yīng)用的全鏈路實時觀測、告警與診斷。阿里云可觀測產(chǎn)品家族同步實現(xiàn)全新升級,最常用的日志服務(wù)SLS相較于自建體系運維監(jiān)控綜合成本可降低30%。 去年,阿里云升級了全新的大模型全生命周期的安全防護體系。在數(shù)據(jù)的采集、模型設(shè)計、訓(xùn)練、評測、部署和使用階段都提供了豐富的安全產(chǎn)品,既包括在模型生成階段的內(nèi)容安全產(chǎn)品,也有數(shù)據(jù)安全中心、數(shù)字水印等數(shù)據(jù)安全產(chǎn)品。 為了實現(xiàn)對數(shù)據(jù)安全的保護,阿里云基于百煉平臺,設(shè)計實施了一系列數(shù)據(jù)安全防護方案,包括專有網(wǎng)絡(luò)訪問通道、Prompt加密、數(shù)據(jù)存儲、應(yīng)用層傳輸加密,以及存儲加密等方式方法,確保企業(yè)數(shù)據(jù)安全。 這些技術(shù)在客戶側(cè)的應(yīng)用正積極推進(jìn),反過來也在不斷從客戶側(cè)獲得寶貴的需求反饋,反哺平臺。作為一個為AI開發(fā)者提供豐富的模型接口與易用工具的平臺,百煉自發(fā)布一年多以來已歷經(jīng)數(shù)次重要迭代。當(dāng)廠商意識到未來卷的不再是基礎(chǔ)模型而是應(yīng)用層面時,可發(fā)現(xiàn)百煉真正是在提前布局,解決用戶在AI發(fā)展中的需求。 開發(fā)平臺的演進(jìn)方向是在提升用戶便捷度的前提下降低用戶使用成本。像百煉新近增加的Context Cache功能,針對在使用文本生成模型時,不同的推理請求之間可能會有重合的輸入內(nèi)容這類場景,通過緩存重復(fù)性輸入大量數(shù)據(jù),對于公共上下文僅收取一次費用,經(jīng)測算最高可節(jié)省90%的成本;同時在Context Cache對這些請求的公共前綴內(nèi)容進(jìn)行緩存后,可在推理時減少重復(fù)運算量,顯著提升模型響應(yīng)速度。 Amazon Bedrock新增的提示詞緩存技術(shù)與此理念類似,也是針對批量處理推理問題時減少重復(fù)的場景,比如一家律師事務(wù)所創(chuàng)建的生成式AI聊天應(yīng)用程序,用于回答律師有關(guān)文本的問題。類似的還有Anthropic API上推出的Prompt Cache功能??梢?,大廠間都在著眼于在細(xì)微的用戶體驗上做不斷改善。 AI基礎(chǔ)設(shè)施競賽升級在基礎(chǔ)模型快速迭代和應(yīng)用開發(fā)逐漸深入背后,一個轉(zhuǎn)變正在悄然發(fā)生。 生成式AI時代不再僅僅是大模型訓(xùn)練能力的內(nèi)卷,一方面資源消耗壓力會讓一些角色逐漸掉隊,另一方面比“拼卡”更重要的是工程化落地的能力,需求已經(jīng)從模型訓(xùn)練轉(zhuǎn)向模型推理和AI應(yīng)用落地。這需要有自己的一套技術(shù)架構(gòu)和范式,更需要緊貼客戶需求,在包括基礎(chǔ)模型、應(yīng)用開發(fā)和AI基礎(chǔ)設(shè)施在內(nèi)的完整體系和生態(tài)上均有過硬實力與市場洞察。 圖片系A(chǔ)I生成 當(dāng)前,企業(yè)對大規(guī)模算力需求增加?!霸谛略鏊懔κ袌錾?,超過50%的新需求由AI驅(qū)動產(chǎn)生,AI算力需求已經(jīng)占據(jù)主流地位。這一趨勢還會持續(xù)擴大。過去一年,阿里云投資新建了大量的AI算力,但還是遠(yuǎn)遠(yuǎn)不能滿足客戶的旺盛需求?!卑⒗锇桶图瘓FCEO、阿里云智能集團董事長兼CEO吳泳銘在云棲大會上說。 無疑,AI對基礎(chǔ)設(shè)施提出了更嚴(yán)苛的新要求,這也是眼下最卷的一條賽道,像算力、成本、時延、安全等,時代在推著云廠商不松懈地往前跑。大廠從自研推理芯片到數(shù)據(jù)平臺、網(wǎng)絡(luò)架構(gòu)都在針對AI進(jìn)行優(yōu)化升級,改變是全棧式的,不光在與同行賽跑,還要和用戶需求賽跑。 同時,企業(yè)越來越注重AI應(yīng)用落地,對多模態(tài)數(shù)據(jù)(包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù))處理能力要求進(jìn)一步提升。但具體來看,客戶需求并不完全相同:有的企業(yè)業(yè)務(wù)復(fù)雜、數(shù)據(jù)量大,需要從微調(diào)訓(xùn)練等早期階段開始定制化開發(fā),與AI技術(shù)深度融合;也有企業(yè)則更傾向于輕量化推理,實現(xiàn)業(yè)務(wù)流和數(shù)據(jù)流的結(jié)合,簡化數(shù)據(jù)庫管理、提升數(shù)據(jù)治理水平。 面對企業(yè)當(dāng)前的綜合性需求,阿里云推出了OpenLake解決方案,可以實現(xiàn)整合大數(shù)據(jù)處理、AI分析以及多模態(tài)數(shù)據(jù)管理一體化,顯著降低數(shù)據(jù)管理和分析的復(fù)雜性,并加速從數(shù)據(jù)中提取價值的過程。 具體來說,OpenLake基于OSS的統(tǒng)一存儲,使用Metadata Service (Data LakeFormation)統(tǒng)一納管結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的多模態(tài)數(shù)據(jù),提供對湖倉表和數(shù)據(jù)文件的安全訪問以及IO加速。向上,提供對大數(shù)據(jù)搜索和人工智能平臺的多引擎對接,包含流、批、增量、搜索多樣化計算支持,實現(xiàn)引擎平權(quán)的聯(lián)合計算,滿足秒級到小時級數(shù)據(jù)處理能力。最后,基于Dataworks Notebook的一站式SQL與Python開發(fā),讓數(shù)據(jù)與模型訓(xùn)練的工作流無縫連接。 而數(shù)據(jù)庫系統(tǒng)也在進(jìn)一步順應(yīng)AI時代的數(shù)據(jù)管理需求,讓多模處理和實時分析能力像搭建積木一樣易用、好用。為此阿里云發(fā)布了由Data+AI驅(qū)動的多模數(shù)據(jù)管理平臺DMS,創(chuàng)新設(shè)計了統(tǒng)一、開放、跨云的元數(shù)據(jù)服務(wù)OneMeta及DMS+X的多模聯(lián)動模式OneOps。 其中,OneMeta首次打通不同數(shù)據(jù)系統(tǒng),可支持全域40+種不同數(shù)據(jù)源,支持他云、自建數(shù)據(jù)源無縫對接,提供數(shù)據(jù)血緣和數(shù)據(jù)質(zhì)量的一站式Data+AI數(shù)據(jù)治理。OneOps則可實現(xiàn)DMS+X的多模聯(lián)動模式,將X( 即云原生數(shù)據(jù)庫PolarDB、云原生數(shù)據(jù)倉庫AnalyticDB、云原生多模數(shù)據(jù)庫Lindorm等多樣化的數(shù)據(jù)存儲、分析、計算、AI引擎)集結(jié)到統(tǒng)一平臺進(jìn)行一站式數(shù)據(jù)和模型任務(wù)編排。數(shù)據(jù)顯示,DMS可為客戶降低高達(dá)90%的數(shù)據(jù)管理成本,使業(yè)務(wù)決策效率提升10倍。 為進(jìn)一步實現(xiàn)靈活高效的異構(gòu)資源管理,阿里云上線了PAI訓(xùn)推一體調(diào)度引擎,即一體化的智算管理與調(diào)度系統(tǒng)PAI Serverless引擎。它是一個集本地訓(xùn)練、云端訓(xùn)練和端側(cè)驗證部署于一體的一站式工作流,最高可擴展10萬卡,有效算力利用率超90%。不難看出,開放與一站式一直是阿里云AI基礎(chǔ)設(shè)施搭建過程中的理念堅持。 業(yè)界已經(jīng)強烈感受到,大模型的到來以及生成式AI的場景落地使人工智能的發(fā)展明顯提速,其發(fā)展節(jié)奏對比主要以機器學(xué)習(xí)為主的AI 1.0時期,要快得多。前期技術(shù)儲備不足的公司已出現(xiàn)掉隊或調(diào)整傾向,一直堅持技術(shù)創(chuàng)新的公司方能適應(yīng)、引領(lǐng)這個節(jié)奏。 中國工程院院士、阿里云創(chuàng)始人王堅認(rèn)為,人工智能和云計算的結(jié)合會帶來云計算的第三次浪潮,它不會在一年、兩年完成,它可能會在十年、幾十年里讓足夠多的創(chuàng)新在云計算時代誕生。如今新的浪潮已來。 基礎(chǔ)大模型、AI應(yīng)用開發(fā)、AI基礎(chǔ)設(shè)施共同構(gòu)成了AI云,而AI云正是面向企業(yè)AI落地需求全棧升級的云,更是云計算在AI時代的延伸。這樣的新趨勢正在席卷全球AI領(lǐng)域,引領(lǐng)一場新的變革。 2009年飛天云計算操作系統(tǒng)問世,掀開了中國云計算的第一頁,阿里云產(chǎn)品技術(shù)創(chuàng)新以此為起點,十幾年間秉承初心,持續(xù)提升技術(shù)實力和創(chuàng)新能力,已經(jīng)成為推動AI云趨勢變革的重要力量。 產(chǎn)品技術(shù)創(chuàng)新之路沒有終點,如果想了解更多阿里云未來產(chǎn)品技術(shù)能力的更新,或回顧阿里云近一年在產(chǎn)品與技術(shù)上所做的升級發(fā)布,可進(jìn)入“阿里云飛天發(fā)布時刻”平臺——以最前沿的技術(shù)和實踐,共同見證AI的“飛天”時刻。(本文首發(fā)于鈦媒體APP) |
19款電子扎帶
電路板識別電子標(biāo)簽