當前位置: 華文世界 > 科技

為何AI藝術總是如此糟糕?

2024-07-12科技

文 | 追問nextquestion

一種說法認為,人工智慧是創意平等化的推動者,它打破了藝術創作的技術門檻,讓懂科技的人可以創作各種形式的作品。「沒有藝術細胞」再也阻止不了人們的創作。

「我們發明這個工具是為了讓創作更加民主——讓自覺不算藝術家的人也能生成影像。」文本生成影像工具DALLE-E的首席研究員說。而OpenAI創始人Sam Altman在他的書中預言,生成式AI將會取代95%的創意性工作。「全部免費、快捷、近乎完美。別說影像,就是視訊甚至活動創意,人工智慧也不在話下。」用另一位AI創業者的話說,「當今世界的藝術創作像便秘一樣滯澀,而我們要讓生產創意性產品像拉彩虹一樣噴薄湧現」。

對於真正的藝術從業者,以及重視消費的文字、影像和音樂的人來說,這顯然是個打擊。每當有顛覆現狀的承諾出現時,總伴隨著合理的擔憂——替代品可能會更糟。這不僅關乎依賴藝術創作謀生的專業人士,也影響到那些熱愛閱讀精心編寫的文字、欣賞深思熟慮的視覺藝術、以及觀看電影尋找可能帶來的驚喜、激勵人心或其他有意義轉變(而非只用於娛樂)的人們。再說,那些認為「拉彩虹」是創意巔峰的人的藝術願景,真的值得被我們嚴肅看待嗎?

取代人工創作的計劃有一重阻礙:到目前為止,AI工具都還不太擅長藝術創作。生成式AI基於訓練數據的模式辨識進行創作,用數據揣摩提示詞主人的意圖。但如果藝術有深於文字或平面組成的含義,有深於金錢交易的價值,那剝離了原始語境後,空洞的數據填充還有意義嗎?

▷一張DALL-E生成的影像。提示詞:「用一張圖片告訴我什麽是藝術」

在用許多人類的偉大作品訓練以後,以ChatGPT為代表的文本生成式AI,以Stable Diffusion、Midjourney、Lensa和DALL-E為代表的影像生成式AI,以Suno為代表的音樂生成式AI以及以Runway和Sora為代表的視訊生成式AI可以呈現出以假亂真、貌似人為的藝術創作。然而只要稍微往下深入探究,它們空洞、無趣的本質就會暴露 [1] 。一位目前在Meta工作的前任記者認為 [2] ,「目前還沒有任何AI生成的作品真正經得住我細品……全是些轉瞬即逝的噱頭。」

如果有一天,未來的人工智慧可以創作出讓人百讀不厭的小說、單曲迴圈的歌曲、願意花高價去影院欣賞的電影,會怎麽樣?或許更關鍵的問題是,這些科技大亨有沒有可能根本搞不懂人類為什麽要創作、要欣賞藝術?

廉價的AI藝術

視覺藝術家運用機器學習進行創作已經幾十年的歷史了,但作品呈現出的一直是藝術家的靈感和思考過程,而不是機器的。概念藝術家Anna Ridler會使用一種叫「生成對抗網路」(GAN)的深度學習架構,完全由她提供的影像進行訓練。相反,當前的文字-影像生成器,例如Midjourney和DALL-E,由互聯網上數以億計的影像訓練而成。「它們藏在API之後,很難做一些概念上有趣的東西。這就是個黑匣子。」Ridler如此評價這些不利於探索創新的公司閉源產物 [3]

這些生成器做出來的東西稀奇古怪,還總有些不對勁:眾所周知,生成式AI對數據的依賴導致其無法準確描繪人手,而據心理學家Gary Marcus所說,AI同樣難以實作統計學上過於小機率的提示詞,例如「一匹騎著太空人的馬」,目前似乎只有人類有如此想象力(最新的AI模型也難免輸出一張太空人騎馬的圖片)。「這些影像有一種詭異的病態,這種特質可能會成為21世紀20年代中期,也就是最近幾年的年代標記,」Ridler說, 「使用這些工具越久,你越會意識到:想透過它們生成有趣的、原創的東西有多難。」

AI真正擅長的,是用鋪天蓋地的平庸、省時的藝術作品洗刷互聯網,打亂創作市場。「當人們看到你市場行銷中的AI圖片,你知道他們在想什麽嗎?你沒有預算。這就是電子版的背香奈兒包仿品,你的整個品牌定位一下就顯得廉價無力。」藝術家Del Walker在X上發表如此言論 [4]

文字生成器也面臨同樣的問題。去年,科幻文學雜誌Clarkesworld創始人Neil Clarke在收到超過一半的ChatGPT生成作品投稿後不再接受投稿。「去年這事剛開始的時候,我告訴大家(AI生成作品)比我們見過最差的人類作家的作品還糟糕,而在一次更新以後,它們跟最差的那一批算是旗鼓相當了。」 Clarke說,「作為統計模型,它總是預判下一個最可能接上的詞,並不真正理解自己在寫什麽。而‘理解’算是講個好故事必須要有的東西吧。」

優秀的敘事作品往往有不止一層含義——僅憑數據,統計模型很可能難以參透文字中的潛台詞和寓意。這也解釋了為什麽AI創作出的故事往往粗淺扁平。Clarke指出,哪怕從語法上無可挑剔,這些文本的可讀性也不高。

「現在,你可以要求GPT-4生成類似完整劇本的東西:120頁,有前後名稱一致的角色和與市面上電影類似的對話,」 身為美國編劇工會委員之一的劇作家John August也分享了他的見解,「它真的合乎情理嗎?這我不知道。可能它好過你讀過最糟糕的劇本,但這標準太低。我們離(AI)創作出人們真正想看的作品還有很長的路要走。」

實際上,AI已經開始參與影視制作了。例如更改演員的嘴型以匹配外語配音,或是制作背景道具、背景人物 [5] 。目前比較有爭議的是有AI參與制作的紀錄片。2021年的作品【格拉斯哥流浪者:一部關於安東尼·波登的電影】( Roadrunner:A Film About Anthony Bourdain )用AI制作了安東尼·波登(已故)說台詞的片段;2022年【安迪·沃荷日記】( The Andy Warhol Diaries )也采用了類似的策略。四月份,存檔制作人聯盟(the Archival Producers Alliance,暫無官方譯名)的領導人共同起草了一份「紀實片人工智慧使用途徑清單」草案 [6] ,包括允許AI修飾或者修復圖片等,同時警告同行必須慎重考慮直接使用生成式AI進行創作。

沒有人可以準確預測人工智慧發展轉折點,但我們知道,目前的科技發展距離所謂「一鍵生成個人客製創作」還有很遠。「試想,用AI生成一部指定演員、情節和地點的電影,完全貼合你的個人喜好。真到了那一天,這種能力會讓普通人可以從頭制作自己的電影,也會讓演員和整個影視相關行業失業。」某個AI行業團體說。

下一代的AI工具完全有可能讓這種幻想成為現實。不過這也引出一個問題:與目前消費的藝術相比,「可以私人客製且完成度高的電影」真的是大多數人想要的嗎?

人工智慧對創意行業的沖擊

不管人工智慧改變行業聽起來有多反烏托邦(例如這項科技被用來制作違背女性意願的色情影像和視訊),我們已經可以看到它造成的影響。與AI一樣,依托社交媒體建立的創意行業初心也是藝術民主化:繞開壟斷的傳統大媒,讓個體有能力創作,並給予他們一個展示的平台。

人工智慧的加入是一把雙刃劍。一方面,AI能讓創作者用新工具制作過去負擔不起或是還沒有能力實作的視效、音效等等;另一方面,AI也帶來了全面升級的詐騙手段。

Ryan Broderick常在自己的簡報網站Garbage Day上討論人工智慧的文化影響。他將AI和社交媒體進行了比較:「我恐怕我們正在駛入一個‘富人享受真人內容,窮人被迫攝取生成內容’的未來。」他認為這和互聯網現狀一致,富人可以訂閱專業人士撰寫的報刊雜誌,而工人階級透過社交媒體獲取資訊,在各種抓人眼球、聳人聽聞的內容中屎裏掏金。

要知道,社交媒體或許擾亂了原本被資本牢牢把手的市場,讓更多人有了展示自己作品的平台,但以此謀生的人並沒有因此增多——甚至可以說社交媒體起到了反作用。真正的獲利者仍然是平台的擁有者,就像這一波人工智慧的開發中獲利的是向高管提供取代人力工具的創始人。

▷Anna Ridler的作品【無數(郁金香)】一件包含上千張郁金香照片的裝置作品,Ridler後來又運用這些素材進行了其他計畫創作。她介紹說,「將這些素材(可以說是一個數據集)以藝術本身的方式呈現,人們能註意到一件作品制作過程中需要的時間、精力和技巧。同時它也展現出了機器學習過程中常常隱藏在演算法之後的人為因素。」

事實上,哪怕AI無法不依賴人類藝術家獨立創作高品質作品,它的存在仍然對創意行業工作者造成了威脅。過去幾年中,藝術家眼睜睜看著自己的作品被用來訓練AI模型,就好像看著自己一點點被取代。

「這讓人禁不住懷疑:如果一台電腦就可以模仿我的作品,我還有什麽才華可言呢?」 一位使用寫作AI工具Sudowrite的小說家這樣說道。年輕人也開始重新考慮是否要踏入藝術界。在去年十月的聯邦貿易委員會關於生成式AI對創意產業影響的圓桌會議上,插畫家Steven Zapata提到:「潛在客戶在網上搜尋我們的名字時偶然發現可以免費下載的AI仿制品,這對我們個人的職業生涯乃至整個行業的市場影響可能是災難性的。」

以科幻小說和科技批判聞名的Cory Doctorow認為,人工智慧藝術的討論中最關鍵的問題是:「我們如何防止本該讓藝術家賺取的錢流入碼農的口袋?」

如何看待AI對藝術的威脅?

誠然,我們應當嚴肅看待人工智慧對生產力帶來的沖擊,以及對倫理和環境的影響,但就如Doctorow補充所說,我們也需要停止無限鼓吹AI的能力。「曾經人們鼓吹Facebook的廣告好到足以洗腦,結果就是臉書的廣告銷量暴漲。現在AI行業銷售人員也在使用相同的話術,提升產品的銷量。」

這也是AI行業銷售人士對藝術的看法:在他們眼中,藝術也是用來買賣交易的商品,而不是用來欣賞感受的精神寄托。2010年,Zadie Smith在一篇評論電影【社群網路】( The Social Network ,講述學生時期的祖克柏創立臉書)的文章 [7] 中提出「使用臉書的感受就像在祖克柏的大腦裏生活」。她寫道,「一切都按照祖克柏的想法設立:他是紅綠色盲,所以軟體是藍色;他認為‘友誼’就是交換個人無關緊要的冷知識,所以你的界面充斥著這類資訊。」

▷由提示詞「藝術家使用 AI 制作精美藝術的肖像」生成的 DALL-E 影像。

為什麽數百萬甚至數以億計的人要遵從這樣的生活方式?我們應該捫心自問,一個大二學生做出來的產品是否是我們交友的最佳方式,就像我們同樣該問自己,是否希望AI高管和他們的支持者決定創作的未來。

億萬富翁、風投資本家Marc Andreesen去年發表了愚蠢言論「科技樂觀派宣言」 [8] ,抱怨與「象牙塔裏的專家」相比,他這樣的人多麽缺乏文化力量。可以合理推斷他口中的意識形態敵人包括倫理學家、學者、工會領袖等——這些人會為了自己和普通百姓的福祉,反對他眼中的「進步」舉措:自由市場、零監管制度和罔顧套用前景而對科技發展永無止境的投資。

有趣的是,「科技樂觀派宣言」恰恰暴露了Andreesen對藝術的理解堪比初中生對文學的理解深度(參考書目:英雄之旅,喬治·歐威爾,哈利波特)。他列出了幾十號「科技樂觀派奠基人」,其中絕大多數是經濟學者,唯一的藝術家是安迪·沃荷。

安迪·沃荷(Andy Warhol)是二十世紀重要的美國藝術家,波普藝術的先驅和核心人物。他的作品內容針對消費社會、大眾文化和傳播媒介,與美國社會的消費主義、商業主義和名人崇拜緊密相連。

就像認為虛擬偶像會取代真人網紅的人不了解網紅受歡迎的原因一樣,認為AI能夠「取締好萊塢」或者音樂、發行行業的人,不懂人們為什麽需要藝術。谷歌的新功能「AI概述」對這個問題的解答是:「欣賞藝術會讓人分泌多巴胺。」

人們欣賞好的作品,不光是因為化學分泌物。藝術挑戰我們的思維,撫慰我們的心靈,激發我們的思考,觸動我們的情感,點燃我們的激情,啟迪我們的精神,促使我們深思。藝術是一個奇跡,欣賞藝術是在同時感受神跡的降臨和人類的存在本身,讓我們體驗人的神性和神的人性。人工智慧常被拿來與邪教相提並論,它的激進支持者近乎虔誠地相信AI有一天會無所不能。但如果你凝視藝術時心中只有表象,那你的產出也無法觸及靈魂。

Doctorow認為,AI生成藝術將會成為一種新的藝術形式,就像歌曲選錄一度受到鄙夷,現在卻成了音樂制作的常見手法一樣。媒體理論學者Ignas Kalpokas認為人工智慧藝術「具有啟示性」 [9] ,揭露了人類對當今社會集體無意識的層面——數據模式。不過同時他也承認,AI創作的作品越多,觀眾「越容易分心」。

歌曲選錄(sampling):指將現成歌曲的采樣片段直接用在新歌中進行二次創作。代表作品:【7 Rings】by Ariana Grande,【My Name Is】by Eminem

按照現在的發展趨勢,未來的藝術與娛樂可能會是這樣:普通人輸入一句提示詞,再輕點按鈕,就能讓個人AI助理生成書影音。但到時候這種形式的娛樂能否吸引我們的註意力還未可知。真到了那一天,創意行業也會和過去的百年間的變化一樣適應新時代。

人文環境的適應力

「專業創意行業的歷史一直存在競爭——電視打電影,電影打廣播,」 AI藝術家兼電子文化評論家Lev Manovich解釋說,「行業轉型可能更偏向現場直播,可能更註重人體表演。如果機器能交出好萊塢級別的媒體作品,那行業就得做出別的東西。這個過程中會有人失去工作,但也會有新的工作崗位出現。」

我很好奇,在現有的科技背景下,什麽條件能讓科幻文學雜誌編輯Clarke同意發表AI生成的小說。「當人工智慧能憑自己的意願寫小說,並自己選擇向我投稿的時候。那就跟外星人沒什麽區別了:我不會拒絕,因為到那一步它已經是新形式的生命。」他說,「但那是科幻小說情節。如果我此生能見識到也不錯,但我不會屏息等待這一天的降臨。」

原文連結:

https://www.vox.com/culture/351041/ai-art-chatgpt-dall-e-sora-suno-human-creativity

參考文獻:

[1] https://www.wheresyoured.at/sam-altman-fried/

[2] https://x.com/tomgara/status/1778803283454218335

[3] https://www.theatlantic.com/technology/archive/2024/01/ai-transparency-meta-microsoft/677022/

[4] https://x.com/thecarteldel/status/1745997488694456637

[5] https://www.axios.com/2023/05/05/runway-generative-ai-chatgpt-video

[6] https://www.hollywoodreporter.com/business/business-news/documentary-ai-archival-producers-draft-set-best-practices-1235874716/

[7] https://www.nybooks.com/articles/2010/11/25/generation-why/

[8] https://a16z.com/the-techno-optimist-manifesto/

[9] https://journals.sagepub.com/doi/pdf/10.1177/01914537231184490