當前位置: 華文世界 > 科技

Suno V3釋出,AI的風終於還是吹到了音樂圈

2024-03-28科技

音樂制作周期從「年月日」壓縮到了「秒」

孫欣

編輯 |姚赟

圖片來源 |Suno官網截圖

「這是它寫的歌詞?包括伴奏嗎?」聽完作品,在被介紹Suno V3的使用方法後,李亮華連續追問:「演唱,混音,伴奏,還有整個作品都這樣搞出來的,還是說只寫了詞跟曲?」

李亮華是湖南第一師範學院作曲老師,也是湖南省創作委員會副會長兼秘書長,曾與韓磊、楊洪基、楊麗達等歌唱家合作。而現在,他還多了一重新的身份——一名小有名氣的網紅。在短影片平台上,李亮華會將征集而來的粉絲投稿作品演唱和點評。他還提到他自己,他現在也用AI人聲錄歌,他抖音上發的部份作品,就是用AI唱的。

在得到肯定回復,並得知正在播放的歌曲從伴奏、歌詞、人聲、編曲都是由AI在獲得關鍵詞數秒內生成後,李亮華感嘆道: 和真人沒什麽區別了,能超越我們99%的人了,我預測 AI在10年之內會幹掉我們大部份作曲的。

3月22日,AI音樂生成軟件Suno釋出了V3版本。我們體驗發現,使用者透過輸入關鍵詞,幾秒內便可制作出2分鐘時長的成品音樂。這些關鍵詞可以指定如搖滾、重金屬、中國古風、流行、鄉村等音樂風格,也可指定如吉他、鋼琴、二胡等伴奏樂器。毫無樂理知識的普通人,也可快速生成自己想要的音樂。一經釋出Suno V3便引起熱議,截至發稿前官宣Twitter已有30w+互動量。

今年是大模型的套用年,以Sora為代表的多模態套用打響了第一槍,而現在輪到Suno了。

只需三步,音樂小白秒變「制作人」

我們也來體驗當一把音樂制作人。「請寫一首歌,描述一個青年追求夢想的故事,吉他,搖滾,鼓,勇敢,克服困難。」我們開啟Suno主頁,輸入了這些需求,然後點選「Create」鍵。靜等幾秒,一首歌曲就完成了。這首被AI創作的歌曲,已完成制作曲譜、填入歌詞、匹配人聲、系統編曲等步驟,算得上一首成品歌曲。

勇往直前版本一 https://app.suno.ai/song/46c3cdd4-8fc9-47f7-be26-74909f06252b
勇往直前版本二 https://app.suno.ai/song/46c3cdd4-8fc9-47f7-be26-74909f06252b

從得到的這首歌來看,曲風基本符合我們的需求。有趣的是,Suno V3每次會同時生成2個版本的音樂作品。使用者可以根據自己的喜好選擇自己中意的版本,還可以接著這2分鐘繼續創作,也可以將其以音訊和影片下載下來。

按照同樣的步驟,我們指定以【將進酒】為詞,以「中國古風」「古箏」為關鍵詞作了一首中國風的歌曲。

將進酒版本一 https://app.suno.ai/song/12ad4c2a-1c57-400f-be84-ccf2ef316310
將進酒版本二 https://app.suno.ai/song/9de2211e-ce03-4338-a8ea-c238b5c0f1ba

在使用的過程中,我們發現,Suno有兩種音樂合成模式選擇,即Custom Mode(自訂模式,可輸入歌詞)和Instrumental(生成純音樂)。使用者可以選擇生成歌曲,也可選擇生成純音樂。具體來看,自訂模式中,使用者可由AI生成歌詞,也可以自己輸 入特定歌詞,比如我們上文中提到的以【將進酒】為詞所做的歌曲,還有網友在Suno V3制作出的【水調歌頭】都是由使用者輸入特定歌詞生成的歌曲。

截止到3月26日,在Suno制作庫排行榜中,收聽量排名第一的是中文搖滾歌曲【We Go!】,生成關鍵詞為heavy metal(重金屬),hard rock(硬搖滾), guitar(吉他),bass(貝斯),drum(鼓),powerful(有力的),aggresive(昂揚)。

We Go!: https://app.suno.ai/song/5c16c93d-0c60-4be1-a65f-c0fafe001a1b

李亮華對這首歌表示震驚,他說AI在音樂創作方面確實是進步很大,甚至稱贊從伴奏制作、後期混音到演唱與真人幾乎沒什麽區別了。

據了解,通常一首歌曲的制作需要經歷靈感獲取 、寫譜、填詞、編曲等一系列流程,大致需要歷時1~2個月左右,成熟的職業作曲人大致1~2天也可完成,一張專輯的完成常常需要以年為單位來計算。 而Suno V3將音樂創作周期從「年月日」壓縮到了「秒」。

對於這首搖滾歌曲【We Go!】,李亮華點評表示:「 Suno在歌詞方面,還是有一定欠缺,整篇歌詞的排布顯得十分空洞、生硬,比其對標的、現在市面上優秀的搖滾曲歌詞,還有一定差距。

原創歌手、音樂制作人極光旅客與李亮華的觀點相似。他這樣說道:「這首【We Go!】是一首中規中矩的簡單搖滾樂,歌曲中的樂器音質基本還原了演出現場樂器的聲音,這比以往常規音樂制作軟件中的音質要真實很多,但目前在Suno聽到的歌曲風格相對人工制作來說比較單一,節奏也比較平淡。」

截止到3月26日,該榜單排行前五中的其他四首歌曲,分別為【Guys what is wrong with my cat】【Deep Night】【Ein neuer Beginn】和【宮保雞丁】。 其中【宮保雞丁】是以菜譜為詞譜出的歌,配合AI人聲演唱反差感十足。

流行歌手楊凱傑表示,目前聽到的這些AI合成音樂作品聽起來很耳熟,相對來說比較粗糙,還無法達到發行的標準。AI生成音樂是基於一定的數據訓練並重組來生成歌曲,能夠輕松生成大量類似作品的同時,也呈現出了高度的同質性。

不到2年,12人的團隊,創造了這款「神器」

這不是Suno第一次出圈。

盡管Suno V3的問世讓大家驚嘆AIGC的神奇,但Suno此前的版本卻並不盡人意。2023年12月21日,為慶祝【海賊王】動畫25周歲生日,制作方WIT STUDIO公司決定籌劃重制【海賊王】「東海篇」。為此,作者尾田榮一郎制作了賀曲【YO-HO-HOおれ達海賊】。而該首曲子便是尾田借助Suno版本所作出來的。

然而,曲目一經官方釋出便被網友吐槽歌曲過於AI化,旋律的編排、簡單的歌詞充斥著機械的聲音,部份網友甚至因此開始抵制動畫。

但尾田所使用的Suno並非近日的新版本,而是V2版本。根據Suno官網的詳情頁面顯示,本次釋出的最新V3版本,主要完成了這三點叠代:

(1)更好的音訊質素;

(2)更多元的風格和流派;

(3)更強的提示遵從性,包括更少的幻覺和更優雅的結尾。

AI進入音樂行業最早可以追溯到上個世紀。20世紀60年代,部份音樂人開始以電腦編程的形式來實作對於音樂旋律的搭建;到了90年代,人工智能技術開始能夠制作出部份樂器的聲音。2001年英國愛丁堡大學的愛默生釋出了E-MI,自此各式各樣的AI音樂制作工具開始逐步成型和發展。當下,音樂人們在進行歌曲創作時,基本都會借助AI音樂制作軟件。

AI合成音樂需要攻破多個困難,這是由於音訊不像文字那樣是離散的形態,聲音是一串波型的連續訊號。 據Suno V3的聯合創始人之一Mikey Shulman表示,因為高質素音訊的取樣率通常為44Khz或48Khz,這意味著「每秒48000個token」。

自2022年末ChatGPT橫空出世開始,過去一年多,人工智能在文本、影像、影片生成等多個領域都呈現出落地與套用化的趨勢。今年年初,Sora問世後,外界更是將其視為「帶入AI 2.0新紀元」的代表。

但,有了這些技術和套用的鋪墊,Suno V3的釋出依舊出人意料。

據【滾石】雜誌報道,Suno創業團隊目前僅12人,成立不到兩年,其中四位聯合創始人分別為Mikey Shulman、Martin Camacho、Georg Kucsko 和 Keenan Freyberg。這四人都是機器學習方面的專家,此前曾共同就職於人工智能企業Kensho。其中,Shulman和Camacho還是音樂家,常常一起即興演出。在 Kensho 公司任職時,四人所在的團隊負責轉錄技術的研發,主要是轉錄上市公司的財報電話會議。

在合力工作中,四人都對於音訊的開發技術產生了濃厚興趣。他們組成初創團隊推出的第一個產品是一個文本轉語音程式,產品名為「Bark」。在該產品釋出後他們對於使用者進行了調研,發現大多數的使用者真正想要的並非文本轉語音之類的技術,而是期待音樂創作方面的技術。

後來四人察覺到,人工智能在文本、影像、影片生成等多個領域的表現十分搶眼。文本生成圖片、文本生成影片領域的多模態大模型正進行著如火如荼的革新,而AIGC在音樂創作方向似乎還沒有相應成熟的技術,於是四人開始著手對Suno的研發。 「我們開始進行了一些初步的實驗,結果看起來非常有前景。」Shulman在采訪中這樣說道。

定位:是工具,不是對手

對於商業化和定位,Suno已想清楚。

Suno的創始人們多次表示,他們想創造的是一個「音樂創造門檻極低」的世界,並設想全球有10億人每個月支付10美元就能用Suno創作歌曲。

AI在音樂行業中的使用並非新鮮事兒。其實此前也有其他AI生成音樂的產品,比如Adobe的Project Music GenAI、YouTube的Dream Track等。李亮華在采訪中表示,20年前自己就開始用AI生成樂器、伴奏了,但也只是部份樂器、人聲AI生成,還是需要人工操作相當多的編排程式,像Suno這樣的「一條龍」服務在過去是完全沒有的。

李亮華還說道,近些年隨著AI音質的提升,他在為學生們上課時也會提到,「再過幾年,大部份歌手也要下崗了」。

隨著數據庫的更新、技術的叠代,AI將在未來5~10年內‘幹掉’作曲人。 」李亮華認為,AI顯然為業內人士敲響了警鐘,但他同時也提到,即便AI技術再升級,永遠有1%是無法被替代的,這1%的來源也正是音樂行業的核心部份:創造力。

此外,楊凱傑還談到,AI合成音樂可能會將音樂創作過度商業化,這完全本末倒置了。他認為音樂創作很多時候是主觀的、能動的、感性的,是自己的生活記錄和情感抒發。機器與人之間的最大區別往往就在於人文情懷,再好的詞曲也比不上「周杰倫」三個字在聽眾心中的存在意義,再無瑕的人聲演繹也難以與Taylor Swift演唱會現場的萬人大合唱相比較。

「AI未來會超越99%的人類,但我不怕它,我反倒期待AI在音樂行業後續的發展,這敦促著音樂人、音樂行業的進步,或特許以進入一種良性迴圈。」李亮華總結。

值得註意的是,Suno V3對於著作權的歸屬問題在官網做了詳盡的描述與規定,同時為了防止模型作品被濫用,還開發了專有的無聲浮水印技術,用以檢測歌曲是否是使用Suno創作。

根據官網介紹,目前Suno平台向使用者免費開放。不過存在一定限制,每位使用者每天最多可免費獲得50個積分,使用者利用這50積分可創作出10首音樂,但這類使用者不能將制作出來的音樂用於商業盈利用途。如果使用者訂閱Suno的Pro計劃,每月支付8美元,每天便能最多制作500首歌曲,並且還可以將這些歌曲用於商業用途,例如上傳至YouTube、Spotify或Apple Music等平台。

參考資料:

【唱作人零門檻!音樂版ChatGPT爆火 包辦詞曲演唱「一條龍」】,財聯社

【What is Suno? The viral AI song generator explained – and how to use it for free】,【技術雷達】雜誌

https://www.techradar.com/computing/artificial-intelligence/what-is-suno-ai

【A ChatGPT for Music Is Here. Inside Suno, the Startup Changing Everything】,【滾石】雜誌

https://www.rollingstone.com/music/music-features/suno-ai-chatgpt-for-music-1234982307/

【音樂領域的「ChatGPT」要來了嗎?】,界面新聞