這樣一張照片,是實(shí)拍還是AI生成? 2024最火AI爆款可靈,年末又卷了一波: 旗下文生圖模型——可圖,完成了1.5版本升級(jí),分分鐘生成平面大片。 還推出了“AI模特”等全新功能。 搭配AI換裝(原AI試衣),奇跡暖暖的快樂(lè)誰(shuí)又懂了(doge)。 不得不說(shuō),上線半年,可靈AI不僅在視頻生成賽道上引領(lǐng)全球風(fēng)潮,產(chǎn)品體驗(yàn)也越來(lái)越全面。 實(shí)際上,AI視頻被引爆的這一年,雖然笑在最前的是OpenAI的Sora,但論笑到最后笑得最好,可能非可靈AI莫屬。 在2024這一年里,可靈率先成為了全球首個(gè)用戶可用的視頻生成大模型,并且在短短6個(gè)月已經(jīng)歷10余次迭代——平均每個(gè)月有兩次以上新動(dòng)作。 AI視頻領(lǐng)域,都是被可靈AI支配的一年。 可靈AI上新「年末大禮包」總結(jié)之前,我們還是先拆個(gè)箱,康康可靈AI準(zhǔn)備的年終禮物,順帶實(shí)測(cè)一波~ 第一樣就是全新上線的可圖1.5圖像模型。 這次主打「畫(huà)面質(zhì)量」和「人像美感」再上新臺(tái)階。 話不多說(shuō),我們打開(kāi)可靈AI中文官網(wǎng),點(diǎn)進(jìn)AI圖片頁(yè)面,并切換到最新可圖1.5模型。 第一關(guān)當(dāng)然是人像生成。為了上難度,我們特意丟給它一大堆攝影專業(yè)名詞:
OMG,效果一出來(lái),確實(shí)令人驚艷。(更像寫(xiě)真而不是一眼AI) 擦亮雙眼又仔細(xì)對(duì)照一遍提示詞,幾乎100%還原了。 而且可以看到,整體構(gòu)圖和光影很協(xié)調(diào),畫(huà)面真實(shí)自然,很像大家生活中拍的藝術(shù)寫(xiě)真。 五個(gè)字:美就完事了! 當(dāng)然除了人像,我們也進(jìn)一步考察了可圖1.5對(duì)更豐富的細(xì)節(jié)層次的掌控程度。
很好,畫(huà)面感這不就來(lái)了??磥?lái)江南水鎮(zhèn)、青石板、烏篷船……這一連串細(xì)節(jié)也難不倒它,不僅色彩還原自然,而且層次感豐富。 一連串試玩下來(lái),先給可圖1.5的“審美能力”蓋個(gè)章。 對(duì)了悄咪咪透露,以上生圖過(guò)程都是免費(fèi)的,新用戶送了366個(gè)積分,一張圖竟然只消耗1積分。(玩的時(shí)候還驚了一下,一下子可以免費(fèi)生成幾百?gòu)埓笃?/span> 與此同時(shí),我們也測(cè)了一波“AI模特”功能,目前主要看到電商&創(chuàng)意營(yíng)銷以及網(wǎng)友整活兩種玩法。 先說(shuō)整體印象,第一次接觸這個(gè)功能就發(fā)現(xiàn)操作非常簡(jiǎn)單,幾乎人人都能立馬上手。 以電商場(chǎng)景舉例,我們可以直接選想要的模特類型(包括性別、年齡、膚色),并自由添加描述。 這里要插一句,如果不知道如何描述,還能點(diǎn)擊“推薦嘗試”,直接用模板或照著模板改。 多次嘗試后發(fā)現(xiàn)“AI模特”出圖非常穩(wěn)定,搭配“AI換裝”后,感覺(jué)非常有希望取代需要店家花錢(qián)的真人實(shí)拍。 這還不算完,我們?cè)侬B一個(gè)buff——可靈圖生視頻能力。
可以看到,商品展示不用進(jìn)棚就能分分鐘“拍攝”完成。 這下,從模特生成到商品動(dòng)態(tài)視頻展示一站式搞定,直接省下了團(tuán)隊(duì)、設(shè)備、攝影棚和后期剪輯的成本。 順便一提,可靈AI這次還新增了尾幀生成能力,并升級(jí)了對(duì)口型功能。 前者指可靈1.5模型(圖生視頻)高品質(zhì)模式下,已支持僅使用尾幀向前生成5秒或10秒的視頻(類似只給一個(gè)大結(jié)局,AI猜前情)。 后者指為了使人物配音更加生動(dòng)自然,新增10款高品質(zhì)音色,并加入了7種不同情感的選擇(包括高興、悲傷、憤怒等)。 看完上述新功能,網(wǎng)友們想要整活的心也是攔不住了。 好家伙!馬斯克也愛(ài)上了東北大花。(bushi 皮衣老黃變身“皮草老黃”可還行。 總之大家已經(jīng)在期待可靈AI的2025年了。 6個(gè)月迭代10余次,可靈AI的“爆款”之路 可靈AI這波可以說(shuō)是從年中卷到了年末。 從市場(chǎng)的角度觀察,盡管在2024年率先掀起視頻生成模型革新浪潮的,是OpenAI的Sora。 但若要論2024年AI視頻生成領(lǐng)域的最大贏家,可靈AI卻是當(dāng)仁不讓的答案。 根據(jù)官方數(shù)據(jù),7月份,可靈AI上線1個(gè)月,就有“超50萬(wàn)人申請(qǐng),開(kāi)放給超30萬(wàn)用戶使用,生成超700萬(wàn)條短視頻”。 截至12月10日,可靈AI用戶量已經(jīng)超過(guò)600萬(wàn),累計(jì)生成超6500萬(wàn)個(gè)視頻和超1.75億張圖片。 國(guó)內(nèi),從微信指數(shù)來(lái)看,在6月份可靈AI正式發(fā)布之后,2024年下半年可靈AI熱度已經(jīng)壓過(guò)了Sora,僅在OpenAI“雙12”期間,Sora終于落地兌現(xiàn)之時(shí)被短暫反超。 海外,根據(jù)Similarweb數(shù)據(jù),截至9月24日,可靈AI總訪問(wèn)量已達(dá)3370萬(wàn)次。11月份最新數(shù)據(jù)則顯示, 可靈AI單月總訪問(wèn)量超過(guò)900萬(wàn),超過(guò)Runway的700萬(wàn)和Pika的500萬(wàn),是視頻生成應(yīng)用中當(dāng)之無(wú)愧的“當(dāng)紅炸子雞”。 此前,Stability AI前CEO Emad Mostaque也曾感嘆:中國(guó)AI視頻生成這次已經(jīng)遙遙領(lǐng)先。 事實(shí)上,盡管發(fā)布晚了4個(gè)月,可靈AI卻是第一個(gè)真正做到讓視頻生成新范式大餅落地、人人可用的AI視頻生成產(chǎn)品,也從一開(kāi)始就奠定了最前沿技術(shù)實(shí)實(shí)在在產(chǎn)品化、商業(yè)化的基調(diào): 6月6日,文生視頻功能“上線即可用”。 7月6日,WAIC 2024上,可靈AI Web端在千呼萬(wàn)喚中火速上線,現(xiàn)場(chǎng)氛圍被認(rèn)為“可能是本屆WAIC上歡呼最多的一場(chǎng)發(fā)布”。 7月底,可靈AI全面開(kāi)放內(nèi)測(cè),并面向全球上線會(huì)員體系。到了8月23日,OpenAPI也上線推出,開(kāi)啟B端合作。 在2024年第三季度業(yè)績(jī)電話會(huì)上,快手CEO程一笑透露:
所以,回顧過(guò)去6個(gè)月,可靈AI“爆款”之路如何進(jìn)階?核心關(guān)鍵詞已經(jīng)逐漸清晰: 快速、可用。 具體可以分為幾個(gè)方面來(lái)看。 產(chǎn)品功能首先,是產(chǎn)品功能的快速完善,和產(chǎn)品矩陣的穩(wěn)步搭建。 6月6日發(fā)布即上線,可靈AI就支持生成2分鐘、30fps的視頻,并且支持多種寬高比。 15天之后,可靈AI正式推出“圖生視頻”功能,并發(fā)布業(yè)內(nèi)領(lǐng)先的“視頻續(xù)寫(xiě)”功能。 值得一提的是,圖生視頻功能擁有很強(qiáng)的逼近世界運(yùn)行規(guī)律的能力,還表現(xiàn)出了很強(qiáng)的泛化能力。 比如水墨畫(huà)這樣的數(shù)據(jù)其實(shí)在可靈訓(xùn)練過(guò)程中接觸非常少,但加上簡(jiǎn)單的提示詞,可靈就能讓水墨畫(huà)中的動(dòng)物自然、真實(shí)地運(yùn)動(dòng)起來(lái)。 7月6日,可靈AI Web端上線,進(jìn)一步把視頻生成、圖像生成和編輯服務(wù)一站式化。 7月下旬,英文Web端KingAI.com面向全球發(fā)布,也標(biāo)志著可靈成為首個(gè)全球用戶可用的真實(shí)影像級(jí)視頻生成大模型。 時(shí)間來(lái)到9月份,可靈AI依然更新不斷: “運(yùn)動(dòng)筆刷”功能上線即爆火,在等社交平臺(tái)上刷屏。 △圖源:@Ror_Fly還推出了“對(duì)口型”等功能。 11月,可靈AI推出獨(dú)立APP,形成多端跨平臺(tái)產(chǎn)品矩陣。 同時(shí)繼續(xù)在功能上解決AI視頻生成痛點(diǎn):AI定制模型(人臉模型)上線,攻克人物一致性難題。 基礎(chǔ)模型能力從技術(shù)角度值得關(guān)注的是,支撐產(chǎn)品快速進(jìn)化的,是可靈AI團(tuán)隊(duì)堅(jiān)實(shí)的基礎(chǔ)模型能力。 6月上線的版本,是基于可靈1.0模型。Web端上線時(shí),就已迎來(lái)基礎(chǔ)模型的升級(jí),包括畫(huà)質(zhì)提升: 生成時(shí)長(zhǎng)擴(kuò)展到一次10s,以及首尾幀控制和鏡頭控制等可控性升級(jí)。 9月19日,也就是可靈上線第3個(gè)月,可靈1.5模型推出。在快手內(nèi)部測(cè)評(píng)中,1.5版本相比于1.0,整體效果提升了95%。 具體而言,相較于可靈1.0,可靈1.5模型在提示詞理解、物理規(guī)律、畫(huà)面動(dòng)態(tài)質(zhì)量上均有提升。 且就在12月19日,可靈基座模型再次升級(jí),1.6版本模型現(xiàn)已上線。 3個(gè)月左右一個(gè)大版本更新的同時(shí),從可靈AI團(tuán)隊(duì)公開(kāi)發(fā)表的一系列論文中,也可以一窺其技術(shù)積累。 比如和中科大、北京大學(xué)聯(lián)合發(fā)表的《Towards Precise Scaling Laws for Video Diffusion Transformers》,探索了Scaling Law在視頻生成模型中的準(zhǔn)確建模,率先提出新的Scaling Law,以實(shí)現(xiàn)視頻擴(kuò)散模型中,對(duì)模型大小和最佳超參數(shù)的準(zhǔn)確預(yù)測(cè)和計(jì)算。 其可控人像視頻生成框架LivePortrait,已經(jīng)在GitHub上積累13.4k標(biāo)星。 內(nèi)容生態(tài)可靈AI還通過(guò)內(nèi)容生態(tài)的構(gòu)建,實(shí)力“破圈”,面向更廣大受眾證明了視頻生成的價(jià)值和影響力。 國(guó)內(nèi)首部AIGC原創(chuàng)奇幻微短劇《山海奇鏡之劈波斬浪》,就是由可靈AI提供深度技術(shù)支持的。 這部AIGC短劇在快手星芒短劇播出后,反響熱烈,截至7月27日,正片5集播放量超過(guò)5200萬(wàn),全網(wǎng)話題曝光量超4.3億,同時(shí)還登上全平臺(tái)熱搜21個(gè),收獲德塔文短劇景氣指數(shù)top1。 最近,可靈AI還聯(lián)合賈樟柯、李少紅等9位知名導(dǎo)演,首映了一系列可靈生成的電影短片。幾位首次接觸AI視頻生成的導(dǎo)演,都紛紛給出好評(píng)。 值得一提的是,在自身面向C端、B端推進(jìn)商業(yè)化的同時(shí)??伸`AI也正在為創(chuàng)作者提供商業(yè)變現(xiàn)的渠道。比如10月18日,可靈AI啟動(dòng)了首期“未來(lái)合伙人計(jì)劃”,在業(yè)內(nèi)率先推出了一站式AIGC生態(tài)合作平臺(tái)。 隨著全球基礎(chǔ)大模型競(jìng)爭(zhēng)格局初定,包括視頻生成在內(nèi)的大模型應(yīng)用,已經(jīng)成為產(chǎn)業(yè)界關(guān)注的焦點(diǎn)。 不少業(yè)內(nèi)人士認(rèn)為,在新一輪的競(jìng)爭(zhēng)中,已經(jīng)在移動(dòng)互聯(lián)網(wǎng)時(shí)代證明產(chǎn)品能力和工程能力的中國(guó)團(tuán)隊(duì),具備很強(qiáng)的競(jìng)爭(zhēng)優(yōu)勢(shì)。 在視頻生成領(lǐng)域,以可靈為代表的國(guó)產(chǎn)大模型后來(lái)居上,引領(lǐng)全球風(fēng)潮,就是一個(gè)例證。 2025年,可以預(yù)見(jiàn)到的是AI應(yīng)用的進(jìn)一步深耕和爆發(fā)。 而AI視頻生成作為商業(yè)化進(jìn)展最快的方向之一,更加值得期待。 在這個(gè)進(jìn)程中,不畫(huà)餅的團(tuán)隊(duì),值得更多的贊賞和鼓勵(lì)。 |
19款電子扎帶
電路板識(shí)別電子標(biāo)簽