D-Think | 東遠(yuǎn)科技-廣州東遠(yuǎn)智能科技有限公司- › 首頁(yè) ›資訊› 科技頭條 › 查看內(nèi)容

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

2024-12-31 14:58| 發(fā)布者: admin| 查看: 72| 評(píng)論: 0

摘要: 這樣一張照片，是實(shí)拍還是AI生成？2024最火AI爆款可靈，年末又卷了一波：旗下文生圖模型——可圖，完成了1.5版本升級(jí)，分分鐘生成平面大片。還推出了“AI模特”等全新功能。搭配AI換裝（原AI試衣），奇跡暖暖的快樂(lè) ...

這樣一張照片，是實(shí)拍還是AI生成？

2024最火AI爆款可靈，年末又卷了一波：

旗下文生圖模型——可圖，完成了1.5版本升級(jí)，分分鐘生成平面大片。

還推出了“AI模特”等全新功能。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

搭配AI換裝（原AI試衣），奇跡暖暖的快樂(lè)誰(shuí)又懂了(doge）。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

不得不說(shuō)，上線半年，可靈AI不僅在視頻生成賽道上引領(lǐng)全球風(fēng)潮，產(chǎn)品體驗(yàn)也越來(lái)越全面。

實(shí)際上，AI視頻被引爆的這一年，雖然笑在最前的是OpenAI的Sora，但論笑到最后笑得最好，可能非可靈AI莫屬。

在2024這一年里，可靈率先成為了全球首個(gè)用戶可用的視頻生成大模型，并且在短短6個(gè)月已經(jīng)歷10余次迭代——平均每個(gè)月有兩次以上新動(dòng)作。

AI視頻領(lǐng)域，都是被可靈AI支配的一年。

可靈AI上新「年末大禮包」

總結(jié)之前，我們還是先拆個(gè)箱，康康可靈AI準(zhǔn)備的年終禮物，順帶實(shí)測(cè)一波~

第一樣就是全新上線的可圖1.5圖像模型。

這次主打「畫(huà)面質(zhì)量」和「人像美感」再上新臺(tái)階。

話不多說(shuō)，我們打開(kāi)可靈AI中文官網(wǎng)，點(diǎn)進(jìn)AI圖片頁(yè)面，并切換到最新可圖1.5模型。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

第一關(guān)當(dāng)然是人像生成。為了上難度，我們特意丟給它一大堆攝影專業(yè)名詞：

一位身著紅色長(zhǎng)裙的舞者，背對(duì)鏡頭，頭微微側(cè)轉(zhuǎn)至四分之三角度，柔和的聚光燈（暖光）灑在她的側(cè)臉上，凸顯出精致的輪廓。她的裙擺隨風(fēng)輕揚(yáng)，周?chē)秋h散的紅色花瓣，仿佛在空中翩翩起舞。背景是一片深邃的黑暗，只有幾束冷光從側(cè)面投射，形成強(qiáng)烈的冷暖對(duì)比。舞者的手腕上戴著一串金色的手鏈，反射出微弱的光芒。大光圈拍攝，花瓣在空氣中呈現(xiàn)出動(dòng)態(tài)模糊的效果，仿佛時(shí)間在這一刻凝固。

OMG，效果一出來(lái)，確實(shí)令人驚艷。（更像寫(xiě)真而不是一眼AI）

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

擦亮雙眼又仔細(xì)對(duì)照一遍提示詞，幾乎100%還原了。

而且可以看到，整體構(gòu)圖和光影很協(xié)調(diào)，畫(huà)面真實(shí)自然，很像大家生活中拍的藝術(shù)寫(xiě)真。

五個(gè)字：美就完事了！

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

當(dāng)然除了人像，我們也進(jìn)一步考察了可圖1.5對(duì)更豐富的細(xì)節(jié)層次的掌控程度。

一座古老的江南水鎮(zhèn)，夜幕降臨，青石板路被細(xì)雨打濕，映出朦朧的倒影。一艘烏篷船靜靜?？吭谑瘶蜻?，船篷上覆蓋著斑駁的茅草，船內(nèi)擺放著竹制茶幾和青瓷茶具，透出古樸的韻味。船頭懸掛著一盞紙燈籠，散發(fā)出柔和的紅光，與水面上的倒影交相輝映。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

很好，畫(huà)面感這不就來(lái)了?？磥?lái)江南水鎮(zhèn)、青石板、烏篷船……這一連串細(xì)節(jié)也難不倒它，不僅色彩還原自然，而且層次感豐富。

一連串試玩下來(lái)，先給可圖1.5的“審美能力”蓋個(gè)章。

對(duì)了悄咪咪透露，以上生圖過(guò)程都是免費(fèi)的，新用戶送了366個(gè)積分，一張圖竟然只消耗1積分。（玩的時(shí)候還驚了一下，一下子可以免費(fèi)生成幾百?gòu)埓笃?/span>

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

與此同時(shí)，我們也測(cè)了一波“AI模特”功能，目前主要看到電商&創(chuàng)意營(yíng)銷以及網(wǎng)友整活兩種玩法。

先說(shuō)整體印象，第一次接觸這個(gè)功能就發(fā)現(xiàn)操作非常簡(jiǎn)單，幾乎人人都能立馬上手。

以電商場(chǎng)景舉例，我們可以直接選想要的模特類型（包括性別、年齡、膚色），并自由添加描述。

這里要插一句，如果不知道如何描述，還能點(diǎn)擊“推薦嘗試”，直接用模板或照著模板改。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

多次嘗試后發(fā)現(xiàn)“AI模特”出圖非常穩(wěn)定，搭配“AI換裝”后，感覺(jué)非常有希望取代需要店家花錢(qián)的真人實(shí)拍。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

這還不算完，我們?cè)侬B一個(gè)buff——可靈圖生視頻能力。

讓模特轉(zhuǎn)身，展示身上服裝搭配。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

可以看到，商品展示不用進(jìn)棚就能分分鐘“拍攝”完成。

這下，從模特生成到商品動(dòng)態(tài)視頻展示一站式搞定，直接省下了團(tuán)隊(duì)、設(shè)備、攝影棚和后期剪輯的成本。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

順便一提，可靈AI這次還新增了尾幀生成能力，并升級(jí)了對(duì)口型功能。

前者指可靈1.5模型（圖生視頻）高品質(zhì)模式下，已支持僅使用尾幀向前生成5秒或10秒的視頻（類似只給一個(gè)大結(jié)局，AI猜前情）。

后者指為了使人物配音更加生動(dòng)自然，新增10款高品質(zhì)音色，并加入了7種不同情感的選擇（包括高興、悲傷、憤怒等）。

看完上述新功能，網(wǎng)友們想要整活的心也是攔不住了。

好家伙！馬斯克也愛(ài)上了東北大花。（bushi

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

皮衣老黃變身“皮草老黃”可還行。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

總之大家已經(jīng)在期待可靈AI的2025年了。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

6個(gè)月迭代10余次，可靈AI的“爆款”之路

可靈AI這波可以說(shuō)是從年中卷到了年末。

從市場(chǎng)的角度觀察，盡管在2024年率先掀起視頻生成模型革新浪潮的，是OpenAI的Sora。

但若要論2024年AI視頻生成領(lǐng)域的最大贏家，可靈AI卻是當(dāng)仁不讓的答案。

根據(jù)官方數(shù)據(jù)，7月份，可靈AI上線1個(gè)月，就有“超50萬(wàn)人申請(qǐng)，開(kāi)放給超30萬(wàn)用戶使用，生成超700萬(wàn)條短視頻”。

截至12月10日，可靈AI用戶量已經(jīng)超過(guò)600萬(wàn)，累計(jì)生成超6500萬(wàn)個(gè)視頻和超1.75億張圖片。

國(guó)內(nèi)，從微信指數(shù)來(lái)看，在6月份可靈AI正式發(fā)布之后，2024年下半年可靈AI熱度已經(jīng)壓過(guò)了Sora，僅在OpenAI“雙12”期間，Sora終于落地兌現(xiàn)之時(shí)被短暫反超。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

海外，根據(jù)Similarweb數(shù)據(jù)，截至9月24日，可靈AI總訪問(wèn)量已達(dá)3370萬(wàn)次。11月份最新數(shù)據(jù)則顯示，可靈AI單月總訪問(wèn)量超過(guò)900萬(wàn)，超過(guò)Runway的700萬(wàn)和Pika的500萬(wàn)，是視頻生成應(yīng)用中當(dāng)之無(wú)愧的“當(dāng)紅炸子雞”。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

此前，Stability AI前CEO Emad Mostaque也曾感嘆：中國(guó)AI視頻生成這次已經(jīng)遙遙領(lǐng)先。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

事實(shí)上，盡管發(fā)布晚了4個(gè)月，可靈AI卻是第一個(gè)真正做到讓視頻生成新范式大餅落地、人人可用的AI視頻生成產(chǎn)品，也從一開(kāi)始就奠定了最前沿技術(shù)實(shí)實(shí)在在產(chǎn)品化、商業(yè)化的基調(diào)：

6月6日，文生視頻功能“上線即可用”。

7月6日，WAIC 2024上，可靈AI Web端在千呼萬(wàn)喚中火速上線，現(xiàn)場(chǎng)氛圍被認(rèn)為“可能是本屆WAIC上歡呼最多的一場(chǎng)發(fā)布”。

7月底，可靈AI全面開(kāi)放內(nèi)測(cè)，并面向全球上線會(huì)員體系。到了8月23日，OpenAPI也上線推出，開(kāi)啟B端合作。

在2024年第三季度業(yè)績(jī)電話會(huì)上，快手CEO程一笑透露：

目前可靈AI的商業(yè)化單月流水超千萬(wàn)人民幣，進(jìn)展符合我們的預(yù)期，未來(lái)我們還將探索更多元的變現(xiàn)模式，我們有信心在明年實(shí)現(xiàn)可靈收入規(guī)模的快速增長(zhǎng)。

所以，回顧過(guò)去6個(gè)月，可靈AI“爆款”之路如何進(jìn)階？核心關(guān)鍵詞已經(jīng)逐漸清晰：

快速、可用。

具體可以分為幾個(gè)方面來(lái)看。

產(chǎn)品功能

首先，是產(chǎn)品功能的快速完善，和產(chǎn)品矩陣的穩(wěn)步搭建。

6月6日發(fā)布即上線，可靈AI就支持生成2分鐘、30fps的視頻，并且支持多種寬高比。

15天之后，可靈AI正式推出“圖生視頻”功能，并發(fā)布業(yè)內(nèi)領(lǐng)先的“視頻續(xù)寫(xiě)”功能。

值得一提的是，圖生視頻功能擁有很強(qiáng)的逼近世界運(yùn)行規(guī)律的能力，還表現(xiàn)出了很強(qiáng)的泛化能力。

比如水墨畫(huà)這樣的數(shù)據(jù)其實(shí)在可靈訓(xùn)練過(guò)程中接觸非常少，但加上簡(jiǎn)單的提示詞，可靈就能讓水墨畫(huà)中的動(dòng)物自然、真實(shí)地運(yùn)動(dòng)起來(lái)。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

7月6日，可靈AI Web端上線，進(jìn)一步把視頻生成、圖像生成和編輯服務(wù)一站式化。

7月下旬，英文Web端KingAI.com面向全球發(fā)布，也標(biāo)志著可靈成為首個(gè)全球用戶可用的真實(shí)影像級(jí)視頻生成大模型。

時(shí)間來(lái)到9月份，可靈AI依然更新不斷：

“運(yùn)動(dòng)筆刷”功能上線即爆火，在等社交平臺(tái)上刷屏。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

△圖源：@Ror_Fly

還推出了“對(duì)口型”等功能。

11月，可靈AI推出獨(dú)立APP，形成多端跨平臺(tái)產(chǎn)品矩陣。

同時(shí)繼續(xù)在功能上解決AI視頻生成痛點(diǎn)：AI定制模型（人臉模型）上線，攻克人物一致性難題。

基礎(chǔ)模型能力

從技術(shù)角度值得關(guān)注的是，支撐產(chǎn)品快速進(jìn)化的，是可靈AI團(tuán)隊(duì)堅(jiān)實(shí)的基礎(chǔ)模型能力。

6月上線的版本，是基于可靈1.0模型。Web端上線時(shí)，就已迎來(lái)基礎(chǔ)模型的升級(jí)，包括畫(huà)質(zhì)提升：

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

生成時(shí)長(zhǎng)擴(kuò)展到一次10s，以及首尾幀控制和鏡頭控制等可控性升級(jí)。

9月19日，也就是可靈上線第3個(gè)月，可靈1.5模型推出。在快手內(nèi)部測(cè)評(píng)中，1.5版本相比于1.0，整體效果提升了95%。

具體而言，相較于可靈1.0，可靈1.5模型在提示詞理解、物理規(guī)律、畫(huà)面動(dòng)態(tài)質(zhì)量上均有提升。

且就在12月19日，可靈基座模型再次升級(jí)，1.6版本模型現(xiàn)已上線。

3個(gè)月左右一個(gè)大版本更新的同時(shí)，從可靈AI團(tuán)隊(duì)公開(kāi)發(fā)表的一系列論文中，也可以一窺其技術(shù)積累。

比如和中科大、北京大學(xué)聯(lián)合發(fā)表的《Towards Precise Scaling Laws for Video Diffusion Transformers》，探索了Scaling Law在視頻生成模型中的準(zhǔn)確建模，率先提出新的Scaling Law，以實(shí)現(xiàn)視頻擴(kuò)散模型中，對(duì)模型大小和最佳超參數(shù)的準(zhǔn)確預(yù)測(cè)和計(jì)算。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

其可控人像視頻生成框架LivePortrait，已經(jīng)在GitHub上積累13.4k標(biāo)星。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

內(nèi)容生態(tài)

可靈AI還通過(guò)內(nèi)容生態(tài)的構(gòu)建，實(shí)力“破圈”，面向更廣大受眾證明了視頻生成的價(jià)值和影響力。

國(guó)內(nèi)首部AIGC原創(chuàng)奇幻微短劇《山海奇鏡之劈波斬浪》，就是由可靈AI提供深度技術(shù)支持的。

這部AIGC短劇在快手星芒短劇播出后，反響熱烈，截至7月27日，正片5集播放量超過(guò)5200萬(wàn)，全網(wǎng)話題曝光量超4.3億，同時(shí)還登上全平臺(tái)熱搜21個(gè)，收獲德塔文短劇景氣指數(shù)top1。

最近，可靈AI還聯(lián)合賈樟柯、李少紅等9位知名導(dǎo)演，首映了一系列可靈生成的電影短片。幾位首次接觸AI視頻生成的導(dǎo)演，都紛紛給出好評(píng)。

值得一提的是，在自身面向C端、B端推進(jìn)商業(yè)化的同時(shí)?？伸`AI也正在為創(chuàng)作者提供商業(yè)變現(xiàn)的渠道。比如10月18日，可靈AI啟動(dòng)了首期“未來(lái)合伙人計(jì)劃”，在業(yè)內(nèi)率先推出了一站式AIGC生態(tài)合作平臺(tái)。

AI視頻突飛猛進(jìn)這一年，國(guó)產(chǎn)之光可靈AI笑到最后

隨著全球基礎(chǔ)大模型競(jìng)爭(zhēng)格局初定，包括視頻生成在內(nèi)的大模型應(yīng)用，已經(jīng)成為產(chǎn)業(yè)界關(guān)注的焦點(diǎn)。

不少業(yè)內(nèi)人士認(rèn)為，在新一輪的競(jìng)爭(zhēng)中，已經(jīng)在移動(dòng)互聯(lián)網(wǎng)時(shí)代證明產(chǎn)品能力和工程能力的中國(guó)團(tuán)隊(duì)，具備很強(qiáng)的競(jìng)爭(zhēng)優(yōu)勢(shì)。

在視頻生成領(lǐng)域，以可靈為代表的國(guó)產(chǎn)大模型后來(lái)居上，引領(lǐng)全球風(fēng)潮，就是一個(gè)例證。

2025年，可以預(yù)見(jiàn)到的是AI應(yīng)用的進(jìn)一步深耕和爆發(fā)。

而AI視頻生成作為商業(yè)化進(jìn)展最快的方向之一，更加值得期待。

在這個(gè)進(jìn)程中，不畫(huà)餅的團(tuán)隊(duì)，值得更多的贊賞和鼓勵(lì)。