12月初,亞馬遜云科技一年一度的re:Invent大會在美國拉斯維加斯大會召開,來自世界各地的超6萬名參會者,他們脖子上佩戴著不同顏色的牌子,穿梭于各個會場之間。 re:Invent大會一直就以務實著稱,但這一屆發(fā)布的產品之多,連很多連續(xù)參會的資深專家都感覺到信息過載——僅僅在三天時間里,亞馬遜云科技CEO Matt Garman與高級副總裁Peter DeSantis、AI和數(shù)據(jù)副總裁Swami博士就發(fā)布了超過30+新品,涵蓋推理芯片、AI服務器、大語言模型、生成式AI開發(fā)工具等等。 在親身感受這些密集的產品發(fā)布過程,可以清晰地提煉出亞馬遜云科技開會和演講的套路,那就是——在服務客戶過程中我們發(fā)現(xiàn)了XX問題,于是我們就推出了XX工具,非常簡單直給。 作為亞馬遜云科技最早、也是應用最深入的客戶,亞馬遜CEO Andy Jassy時隔多年再次亮相re:Invent,這次他不僅一口氣發(fā)布了6款Amazon Nova模型(包括4款基礎模型,1款圖像生成模型和1款視頻生成模型),更是作為亞馬遜云科技最早、也是應用最深入的客戶(據(jù)他透露,亞馬遜內部已構建或正在構建近1000個生成式AI應用程序),他分享的關于亞馬遜應用AI的三個核心問題——選擇、成本和需求,完全可以作為理解本次大會的基本邏輯。搞懂了這三個問題,再看這30多個產品發(fā)布的背后思路就很清晰了。 更自由的選擇“當你嘗試構建某些東西或者做決策時,常常需要在A和B之間做選擇嗎?這種選擇其實限制了你的思路。在亞馬遜云科技,我們不這么思考問題。”亞馬遜云科技一年一度的re:Invent大會上,亞馬遜云科技CEO Matt Garman在主題演講時,這樣表達了對技術應用的理解。 Matt認為,“做選擇”實際上制造了虛假邊界,“讓你馬上開始想自己必須選A或者選B,但我們推動團隊去思考如何同時達成A和B,就可以讓大家換一種方式思考”。 在Matt眼中,開發(fā)者與客戶永遠有選擇最優(yōu)產品的權利。這是亞馬遜云科技成立時秉承的理念,無論是一兩百款EC2,還是上百款數(shù)據(jù)庫——亞馬遜云科技一直都認為,客戶的需求大于一切,那么需求的多樣性就決定了選項的多樣性。 亞馬遜云科技愿景文件撰寫于2003年。彼時,眾多科技公司紛紛構建捆綁式的解決方案,試圖大包大攬。最終形成的是龐大而單一的解決方案,雖功能全面卻僅達合格水準。但合格不應是追求的終點,人們真正渴望的是最優(yōu)組件。若能將所有頂尖元素整合一體,那才堪稱完美?!盎诖四?,亞馬遜云科技應運而生?!盡att說。過去18年,靈活的技術構建模塊,也成為亞馬遜云科技服務逐漸向上的執(zhí)念。 這一理念也表現(xiàn)在時下熱議的大模型服務上?!霸趤嗰R遜內部構建項目中所使用模型的多樣性令人驚訝。給予了開發(fā)者自主選擇的權利,原本以為大家都會選用Anthropic的Claude模型,畢竟過去一年多它在全球屬于性能頂尖的模型,確實有很多內部開發(fā)者在使用Claude模型,但他們也會采用Llama模型、Mistral模型,甚至會使用自行研發(fā)的模型?!盇ndy Jassy演講時談及亞馬遜落地生成式AI的經(jīng)驗,“因為一直都在汲取同一個教訓,那就是永遠不會出現(xiàn)一種工具能在某個領域一統(tǒng)天下的情況。就像數(shù)據(jù)庫領域,探討了10年,大家會使用各種各樣的關系型數(shù)據(jù)庫或者非關系型數(shù)據(jù)庫;就像大數(shù)據(jù)領域討論了很久是不是TensorFlow會一統(tǒng)天下,結果PyTorch更受歡迎?!?br> Amazon Bedrock Marketplace是Swami博士在現(xiàn)場發(fā)布的其中一款新品。這是一個擁有100多個領先大模型的“市場”,Amazon Bedrock中的統(tǒng)一體驗極大簡化模型開發(fā)工作流程,給用戶帶來了前所未有的靈活度,將讓模型推理從“非A即B”的選擇達到成本與延遲的“微妙平衡”。 “對一個因素的優(yōu)化通常需要對另一個因素進行妥協(xié),這是因為成本和響應延遲與道德準確性呈反比關系,因為功能更強大、高度智能的模型會消耗更多的資源?!盨wami博士講述從客戶了解到的需求。而在更新的Bedrock上,新模型蒸餾功能,使得用戶可以將特定知識從更大、更準確的模型轉移到更小、更高效的專業(yè)模型,使其速度提高500%,成本降低75%。 但是多元化的選擇,也難免面臨一些天然存在的競合關系,比如亞馬遜云科技在向客戶提供模型市場、模型開發(fā)平臺的同時,也推出了自己的基礎模型。不過,亞馬遜云科技一直以來都是開放性的看待這種競合關系。 對于亞馬遜云科技的模型策略,Andy Jassy做了這樣的回答:“我們一直以來的目標就是為大家提供選擇,現(xiàn)實情況是,大家在不同的時間、出于不同的原因,都會使用不同的模型。 這其實反映了現(xiàn)實世界的運行規(guī)律。就好比人類不會只找一個人去獲取各個領域的專業(yè)知識一樣,不同的人在不同的方面各有所長。有時候大家會側重于優(yōu)化編碼,有時候關注數(shù)學,有時候看重與檢索增強生成(RAG)的集成,有時候聚焦智能需求,還有時候在意更低的延遲或成本問題。大多數(shù)情況下,是各種因素的組合決定的。 在亞馬遜云科技,我們會為大家提供這些因素組合之后,滿足需求的選擇。我們認為,最近又為這個組合增添了一些非常有趣的模型。好消息是,所有這些模型都能在Amazon Bedrock中使用,大家可以按照自己期望的任何組合去使用它們,進行試驗,并根據(jù)情況做出相應的調整?!?br> 可接受的成本云計算的成本問題,一直是Matt最為關心的問題。 2018年,亞馬遜云科技曾經(jīng)做過一個瘋狂且頗具爭議的決定:開發(fā)自己的芯片。即Amazon Graviton,以期在ARM內核變得越來越快、越來越強大的背景下提供差異化價值?,F(xiàn)在,Amazon Graviton被幾乎每個亞馬遜云科技客戶廣泛使用。Amazon Graviton提供比x86高40%的性價比、減少60%的能源消耗,也極大縮減了云計算成本。 以圖片分享網(wǎng)站Pinterest為例。在轉向Amazon Graviton之前,Pinterest運行著數(shù)千個x86實例來運營他們的業(yè)務。轉向Amazon Graviton之后,Pinterest將計算成本降低了47%,碳排放減少了62%?!八麄儾⒉还聠?,90%的前1000個Amazon EC2客戶都開始使用Amazon Graviton?!盡att說。 現(xiàn)在,生成式AI時代來了,當下最大的計算問題都與AI相關。雖然與NVIDIA有著長達14年的合作關系(搭載NVIDIA新Blackwell芯片的Amazon EC2 P6服務器將于明年年初推出),也是NVIDIA的大型生成式AI集群場所,但GPU依然成了亞馬遜云科技為計算降本的新目標:推出一款專為尖端生成式AI訓練和推理這類高要求工作負載而設計的GPU。 會上,亞馬遜云科技最強Amazon EC2 Trn2計算實例發(fā)布。配備16個Trainium2芯片,一個Amazon EC2 Trn2實例可在單個計算節(jié)點提供20.8 petaflops的計算能力,Amazon EC2 Trn2實例提供比當前GPU服務器高出30%到40%的性價比,這些芯片通過一種稱為NeuronLink的高帶寬、低延遲互連連接在一起。 AI大模型公司Anthropic聯(lián)合創(chuàng)始人兼首席計算官Tom Brown12月2日在re:Invent演講時當場宣布,下一代的Claude模型將在Project Rainier上進行訓練,他表示這將是一個新的計算集群,擁有數(shù)十萬個Amazon Tranium2芯片。優(yōu)化完成后,該集群預計將成為迄今為止世界上最大的AI計算集群,可供Anthropic構建和部署其未來模型。 “數(shù)十萬個芯片意味著數(shù)百個密集的億次浮點運算,比我們曾經(jīng)使用過的任何集群都多五倍以上。這意味著客戶將可以更低的價格、更快的速度獲得更多的智能。有了Amazon Tranium2 和Project Rainier,我們不僅僅是在構建更快的人工智能,還在構建可擴展的、值得信賴的人工智能。”Tom Brown表示。 Andy Jassy在演講時也多次談及“成本”,他認為當生成式AI應用程序達到一定規(guī)模時,計算成本的重要性就凸顯出來了,大家都迫切希望獲得更高的性價比,即既能控制好延遲,也要具備合理的成本結構。據(jù)他觀察,從全球范圍來看,那些應用AI最為成功的公司,主要體現(xiàn)在成本規(guī)避和生產力提升方面,而且很多公司在這兩方面都取得了進展。但值得一提的是,亞馬遜云科技的成本控制,是體現(xiàn)在整場的產品創(chuàng)新上,而非簡單的價格。 需求導向,實用AI如果一定要給亞馬遜云科技的AI戰(zhàn)略做一個定義,需求導向的實用AI或許更為精確。 “很多時候,人們用上不錯的模型做了些工作,就以為打造出很棒的生成式AI應用程序了,但實際上可能只完成了大概70%的工作,而客戶不會喜歡存在那30%問題的應用程序?!盇ndy Jassy表示。以亞馬遜自己為例,加入生成式AI這個“智慧大腦”之后,亞馬遜聊天機器人客戶滿意度提升了500個基點,“這就是實用AI的體現(xiàn)?!盇ndy Jassy說。 客戶至尚和逆向工作法,是亞馬遜云科技DNA的一部分。亞馬遜云科技創(chuàng)業(yè)初期,由于合規(guī)性、審計、監(jiān)管、安全、加密等考量,大部分的銀行客戶表示愿意采用云計算,但稱可能永遠不會上云。亞馬遜云科技沒有放棄這些金融客戶,而是接下來花了十年來解決銀行客戶清單上的每一個問題?!敖裉?,我很自豪地說,許多大型金融公司都是我們的客戶。因此,當你在創(chuàng)新時,重要的是要記住,你真的要從客戶開始。你要問他們什么對他們重要,但你不僅僅是交付客戶要求的東西。你要為他們發(fā)明。”Matt說。 AI時代也是同理:要為客戶發(fā)明好用的AI工具。 會上,Swami博士發(fā)布了新一代Amazon SageMaker。從功能上看,SageMaker AI與客戶的數(shù)據(jù)強相關,是一個集合了數(shù)據(jù)調用、數(shù)據(jù)分析、大模型訓練的一站式平臺,定位上發(fā)生了重大的變化。 “許多客戶向我們反饋,他們的分析和AI工作負載越來越多地圍繞相同的數(shù)據(jù)和相同的工作流程進行融合。這正在改變其對分析服務的看法,因為事實證明,他們不再僅僅孤立地使用分析和AI工具,他們正在使用歷史分析數(shù)據(jù)來訓練機器學習模型,并且越來越多地將相同的數(shù)據(jù)納入其生成式AI應用程序中?!盡att談及從一個客戶案例中獲得的啟發(fā)。這也不難理解,因為數(shù)據(jù)才是企業(yè)的核心資產,才是差異化的競爭力,而非模型,將企業(yè)絕對優(yōu)勢的數(shù)據(jù)和大模型整合在一個平臺上,才會有優(yōu)勢。 綜合來看,對客戶來說,AI落地的工具越來越多;對亞馬遜云科技來說,他們又用一年的時間把AI生態(tài)這個木桶所有的木板都加長了一大截;對行業(yè)來說,這個市場又被卷緊了好幾圈,競爭的焦點也逐漸從大模型本身轉移到了工具和落地上。 附:亞馬遜云科技re:Invent2024產品發(fā)布全景(筆者現(xiàn)場整理) (本文首發(fā)于鈦媒體APP,作者 | 秦聰慧,編輯 | 劉湘明)? |
19款電子扎帶
電路板識別電子標簽