作者:沈湫莎 “留給我們的唯有一條路,那就是希巴拉克的道路……”這首由Suno AI創(chuàng)作、于今年元旦上傳到嗶哩嗶哩(B站)的歌曲《奧奇坎金曲》成了爆款,目前播放量已突破250萬,也讓向來“低調(diào)”的AI作曲在人們面前“秀了一把肌肉”。 Midjourney、Suno、Sora分別是AI繪畫、AI音樂和AI視頻的代表軟件,分別發(fā)布于2022年3月、2023年12月和2024年2月。隨著這些現(xiàn)象級工具的出現(xiàn),AI正快速滲透到越來越多藝術(shù)創(chuàng)作領(lǐng)域。有意思的是,三者的大眾影響力大相徑庭,Sora發(fā)布對人們的沖擊力最大,而抵制AI繪畫的呼聲則最高。 “小步快跑”之下,AI藝術(shù)創(chuàng)作究竟有哪些進步?哪種藝術(shù)創(chuàng)作最不容易被AI取代?AI藝術(shù)創(chuàng)作是否還有更多可能性?記者就此采訪了相關(guān)專家和玩家。 導(dǎo)演賈樟柯用可靈創(chuàng)作的首部AI電影畫面。 一曲成名,“無名之輩”有了主題曲 今年元旦,米哈游旗下開放世界冒險游戲《原神》發(fā)布5.3版本《熾烈的還魂詩》,來自提瓦特大陸納塔地區(qū)的“火神”瑪薇卡和來自至冬地區(qū)的愚人眾執(zhí)行官“隊長”迎來高光時刻。 “火神”“隊長”都是原神團隊用多個版本鋪墊的人物,擁有大量臺詞和動畫演出,甚至有自己的主題曲。令人意外的是,一個并未過多著墨、甚至沒有形象的角色,通過一首極具傳唱度的AI二創(chuàng)歌曲而火了起來,它就是“蛇王”奧奇坎。 奧奇坎的故事零星散落在開放世界的各處文本中,需要玩家探索獲得,將文本輸入音樂生成模型Suno AI并選擇相應(yīng)曲風(fēng),一次可生成兩首歌曲。在朗朗上口的旋律加持下,奧奇坎的故事很快被傳播開來,并擁有了不輸于“火神”和“隊長”的人氣。 歌曲的“破圈”能力不容小覷:《原神》2022年出圈歌曲《神女劈觀》的B站播放量已近3600萬;米哈游另一款旗艦作品《崩壞:星穹鐵道》上個版本匹諾康尼的主題曲《不眠之夜》的B站播放量已達4300多萬;而今年上線的《絕區(qū)零》,米哈游甚至?xí)o每個出場角色專門定制歌曲。 奧奇坎的“傳播奇跡”讓眾多網(wǎng)友在探索原神大世界時有了更多樂趣。有人注意到,三年前《原神》的璃月版本,有一個與奧奇坎經(jīng)歷相似的角色若陀龍王留下了大量文本。珠玉在前,或許若陀龍王由玩家二創(chuàng)的主題曲也已在路上。 有手就行,AI藝術(shù)創(chuàng)作已超人類平均值 AI作曲真的有手就行?上海溫哥華電影學(xué)院3D動畫系主任、AI創(chuàng)作“發(fā)燒友”徐一然現(xiàn)場演示了用Suno AI作曲的全過程。最簡單的操作只需兩步:文本填入對話框,點擊開始即可,一次能生成兩首歌曲。如果想要生成更有個性的歌曲,可將文本按照前奏、主歌、副歌、橋段、尾奏等作曲格式標(biāo)注好,在提示詞中寫明需求,比如用什么樂曲、表達什么樣的情感等,并選好曲風(fēng)。 去年底,Suno AI發(fā)布了全新版本,帶來兩個非常實用的功能。一是可以“定向創(chuàng)作”,也就是用戶可上傳音頻,比如隨口哼出的一段旋律,在基礎(chǔ)上,AI可以續(xù)寫補全為一首完整的歌,不限時長。二是可以指定聲音作為歌唱者,比如在《奧奇坎金曲》中,UP主就上傳了自己的聲音,而后續(xù)翻唱者則發(fā)布了各自聲音的翻唱版本。 與Suno AI的迭代策略相似,Midjourney也在以小步快跑的方式更新?!艾F(xiàn)在AI繪畫已經(jīng)很少出現(xiàn)多個指頭的情況了,用戶也可選中局部畫面進行生成?!毙煲蝗徽f。 相比之下,去年被視為AIGC(生成式人工智能)領(lǐng)域“王炸”的Sora卻掉隊了,如今AI文生視頻模型的頭把交椅已被快手旗下的“可靈”穩(wěn)穩(wěn)占據(jù)。自去年下半年起,Midjourney+可靈幾乎是外網(wǎng)視頻生成的標(biāo)配。徐一然說,相較于Sora,可靈在清晰度、文本理解能力和視頻長度方面實現(xiàn)超越。更重要的是,可靈已拿出商用產(chǎn)品,而Sora磨磨蹭蹭一年半后才推出面向公眾的版本,市場早已被瓜分。 徐一然曾用可靈生成過一個女孩手推玻璃罩的場景,可靈已經(jīng)能意識到當(dāng)女孩的手接觸到玻璃時會產(chǎn)生“凸透鏡效應(yīng)”,因此畫面上的手看上去變大了。Sora引以為豪的2分鐘生成視頻長度也被突破,可靈上個版本已可實現(xiàn)無限延續(xù),不過目前畫面仍難以保持統(tǒng)一。徐一然預(yù)測,以當(dāng)下的速度發(fā)展下去,可靈再迭代兩三個版本,就能解決畫面統(tǒng)一的問題。 事實上,互聯(lián)網(wǎng)上已經(jīng)有越來越多的可靈生成視頻占據(jù)人們的眼球,目前最火的是“小貓做飯”和“手辦動了”兩類,觀眾甚至意識不到它們是由AI生成,而把它們當(dāng)成是某類動畫。而就大多數(shù)AI生成藝術(shù)作品的質(zhì)量來看,已超人類平均水平。 回歸文字,藝術(shù)領(lǐng)域開疆拓土仍需靠人 同為AI藝術(shù)創(chuàng)作,大眾的接受度卻高低有別,其中接受度最低的就是AI繪圖。《游戲研究》編輯、游戲主創(chuàng)王安礎(chǔ)注意到,2022年底曾發(fā)生過一場關(guān)于AI創(chuàng)作的大規(guī)模討論,主要是由于AI繪畫引起的。去年,不少游戲因疑似使用AI繪畫而陷入爭議,但被質(zhì)疑的廠家一律選擇以沉默回應(yīng)。 AI作曲雖存在爭議,但贊賞的聲音也很多。古風(fēng)歌曲愛好者兔美表示,以前她根本接觸不到好的作曲編曲,而且花錢請人作曲的成本很高,盡管她有作詞能力,但成曲寥寥。有了AI作曲工具后,她可以生成很多作品,而且效果不差。 對于AI視頻,人們似乎從一開始就接受了它的存在。業(yè)內(nèi)專家曾這樣評價Sora:往小了說,是文生視頻技術(shù)突破了一個數(shù)量級,可直接應(yīng)用于短視頻、廣告等行業(yè);往大了說,它提供了理解、重建和模擬這個世界的可能性。 為什么同為AI藝術(shù)創(chuàng)作,接受度卻不相同?在王安礎(chǔ)看來,主要是由于受眾基數(shù)不同以及不同藝術(shù)形式的創(chuàng)作門檻不同。簡單來說,受眾基數(shù)越小、創(chuàng)作門檻越高、人們的接受度越高。 B站UP主“孫工普拉斯”則從創(chuàng)作靈感出發(fā)提供了另一個觀察視角。繪畫事實上是個體力活,從古至今,創(chuàng)作一幅畫作少則幾天,多則幾年,而繪畫的“神來之筆”大多是在繪畫的過程中產(chǎn)生的,大量雷同的AI作品并不能給畫師提供靈感,反而壓低了他們的收入。 音樂則不一樣,它的靈感大多源于創(chuàng)作之前。比如創(chuàng)作出《云宮迅音》的許鏡清,是聽到一幫民工敲飯盒“丁零當(dāng)啷”的聲音后才有了靈感,于是很快寫下經(jīng)典之聲。因此,當(dāng)作曲家枯坐案臺毫無靈感時,聽聽AI創(chuàng)作,或許能從各種音符的拼接組合中找到靈感,寫下屬于自己的作品。因此,作為提升生產(chǎn)力的工具,AI作曲無論在專業(yè)人士還是普通人群中的接受度都更高。 在科學(xué)界,愛因斯坦曾有一個比喻:頂尖科學(xué)家是游走在人類認(rèn)知邊界的人,當(dāng)他們向外探出一小步,人們認(rèn)知的直徑就擴大一點。在徐一然看來,藝術(shù)家則是游走在人類精神認(rèn)知邊界的人,AI能夠達到人類藝術(shù)的平均水準(zhǔn),但開疆拓土永遠(yuǎn)要靠人。 有趣的是,當(dāng)AI讓藝術(shù)創(chuàng)作變得“有手就行”,一項人人都會卻總是被忽略不計的能力愈發(fā)凸顯出其重要性,那就是文字功底。對Suno AI來說,歌曲好壞的勝負(fù)手變成了歌詞,那些優(yōu)美、押韻的文字大概率能一鍵生成一首好聽的歌。而當(dāng)遇到不那么好的文字時,甚至AI都會“吞”掉一部分來保持樂曲的整體和諧。(沈湫莎) 來源: 文匯報 |