花暉｜當AI入侵藝術創作的作業系統 - 科技

2024-07-13科技

「人工智能已入侵人類文明的作業系統。」這是【人類簡史】作者尤瓦爾·赫拉利對於AI叠代之迅猛而發出的感嘆及憂慮。赫氏素來以演化生物學的角度闡釋人類歷史，當過往的「AI威脅論」集中於智慧機器奴役或滅絕人類，赫氏則認為今天的AI具備了操縱及生成語言的非凡能力，出現「會講故事的電腦」無疑將成為人類史的一個拐點。

考察AI藝術創作領域，這種「入侵作業系統」的狀態已初現端倪且迅速蔓延，那麽機器語言將如何影響人類的創作思維及美學表達？在人機互動的系統框架中，各自又將扮演怎樣的角色？

詞元生萬物是語言的前進演化還是退化

赫拉利認為語言是人類文明的基本要素，而正是透過改變語言表達的習慣與構成，AI得以「操縱」人類觀察及思考的方式。換言之，「矽基生命」正嘗試從根本上瓦解並重塑最頂端碳基生命的文明累積系統。

赫氏的一系列觀點顯然將AI視為入侵物種而懷有「敵意」，但由語言這個極為重要的符號系統出發，思考AI與人類文明的現時及未來關系，確是一條新穎而有效的路徑。不妨由「提示詞」開始我們的討論。

但凡對AIGC稍有接觸，便不會對文生圖、文生影片感到陌生。想象一下在文本框內輸入蒙娜麗莎、立體主義兩則提示，AI送出的極大可能是畢加索版的神秘微笑，你當然還能額外獲得波普版、水墨版乃至黏土版。文本驅動是AI創作的最基本形式，由此看來，AI對人類最直觀的「操縱」在於那些連續的、高度依賴上下文的語意表達，由斷裂、跳躍的語素、詞、熟語等語言單位直接完成了，且完成的形式在情境的邏輯性、完整性上日趨合理，並越來越清晰地展現出一種機器創意。這就導致一個悲喜難辨的結果：當我們將語意表達的概念拓展至藝術創作，過往那些引以為豪的豐富經驗、刻苦訓練、入微觀察、情緒峰值，都在體量盡可能縮小的音義結合體面前，顯得性價比很低。隨著提示詞工程師成為職場新寵、9塊9的AIGC課程充斥網絡，人工智能顯然帶來了「6·18」般的創作狂歡。

那麽回到語言的討論範疇，基於提示詞的「作業系統」究竟是一種前進演化還是退化？

在AIGC的語言模型中，「詞元」這一轉譯代表著機器以數碼形式來讀懂人類詞句的最小語意單位。提示詞中的長文本經由「分詞」步驟拆解為詞元，並透過嵌入、位置編碼等一系列處理，由物理世界的非結構化數據轉為機器可理解的結構化向量，圖片、影片等多模態輸入的最終目的地也便是多維向量。

暫不展開復雜的技術機理，而用螞蟻搬家的故事來理解一下詞元的無窮力量。一只螞蟻承載負重、兜兜轉轉大半天回到蟻穴，而當成千上百集體遷移時，卻能驚人地依據地形選擇出最便捷、最合理的行進路線，路遇急流亦會抱作一團滾入河中，透過犧牲少數邊緣個體而獲得蟻群的勝利。這種整體大於部份之和的智能爆發被理論生物學家Beta朗菲稱為「湧現」，而一旦突破聚合的奇異點，宇宙起源與生命演化都在湧現之列。

詞元就像一只螞蟻，當我們投餵足夠多的語料給大語言模型後，由表及裏湧現而出的是AI對於提示詞中潛藏的藝術風格及情感傾向，產生了辨識、理解以及「想象」——假設我們意欲為「一鍵生成」添加一些擬人的色彩。同時於規模法則之下，隨著模型尺度急劇增大，其計算精準度呈現出昂然上揚的冪律曲線。正如OpenAI從未將Sora簡單地等同於影片模型，而是野心勃勃地稱其為「世界模擬器」，當你察覺到墨鏡女郎鏡片上的反光時，囈境與現實間的界線似乎並不那麽重要了。

表面上看，多模態提示詞代表著創作界面的全然改頭換面，而背後的詞元生萬物，體現出機器對藝術世界新一階段的理解與掌握，更是人類在新一階段對藝術思維的形成與表達、創作工藝的更新與再造產生了顛覆舊知的認識與行動。

一個有趣的例子是前不久全球首部AI長片【我們的終結者2重制版】上映，故事背景設定為ChatGPT一統天下的未來世界，OpenAI派遣機器人穿越時空刺殺人類反抗軍領袖山姆·柯曼，也即是現實中OpenAI的創始人，整體情節與經典科幻片【終結者2】形成了呼應。撇開影片中部份影像細節的不到位，其制作本身便掀開了電影工業的新篇章。專案啟動於好萊塢編劇大罷工之際，在傳統電影技術崗位缺失的前提下，50名AI藝術家利用ChatGPT、Midjourney、Runway等五花八門的AI工具，完成了50個彰顯個人風格及工具特性的影像片段，整部長片由此「拼湊」而成。這樣的「草台班子」在3個月內完成了編劇、導演、場記、美術、配樂等所有標準工業流程，證明了AI在降低使用門檻的同時，帶來了跨學科、跨門類的通用智慧。

若將語言範疇由藝術創作的技法與規律，再度拓展至認識宇宙世界的執行真理，這種通用智慧則更令人驚嘆。Deep Mind旗下的AlphaFold於數年前，已預測出100萬個物種超過2億個蛋白質的結構，幾近涵蓋地球上所有的已知蛋白質，而今天的AlphaFold 3已將預測範圍擴充套件到了更為廣泛的生物分子。顯然AI在各個領域對於幫助人類認識自身，發揮著日益積極的作用，那麽人類又該如何可持續性地與AI相處？

從逆向圖靈測試到人文的勝利

近日一位AI獨立開發者設計了一項別出心裁的遊戲，將亞里士多德、莫札特、達·芬奇、克利奧帕特拉、成吉思汗五位「角色」設定於AI世界的一節車廂中，其中只有一位是人類，其它幾位均為GPT、Claude、Gemini等頭部引擎驅動的AI玩家，五人間透過互相問答，並以投票形式決出誰是混入的異類。人類扮演的角色最終被四位AI玩家中的三位以缺乏領導力與戰略思維為由，判定為非我族類。

若熟知70多年前的圖靈測試，此次由機器檢驗人類的反向實驗便顯得格外有趣且有深意。在愈來愈緊密的人機系統中，如何與AI相處，便成了一個需要回答的問題。

在現時的答案中，過往的「工具論」顯然不合時宜，AI不再是輔助導演完成分鏡、幫設計師生成草圖的簡單機器，一種相互補充與激勵的「友伴論」是良好的起點，正如跳躍的提示詞，將由AI填補創作的空間。又一個值得一提的案例是由商湯科技、上海人工智能實驗室參與研發的首個人體動捕大模型SMPLer-X。得益於450萬個例項的數據訓練，樣本影片中人體姿態的多樣性、局部動作的復雜性，都能被快速且高質素地辨識並提取出來，這意味著CG制作展現出了一種嶄新的未來。

由1937年【白雪公主和七個小矮人】、1941年【鐵扇公主】啟用轉描技術算起，逐幀摹繪、慣性測量、光學動捕等一系列方法都離不開巨大的人力物力，而AI生成式動捕擺脫一切傳感器，由網絡攝影機、手機乃至網絡影片中直接采集獲取動作數據，在大幅削減成本的同時，著實降低了制作人員的工作難度與強度。

在這樣的創作友伴關系中，藝術家們理應受到鼓舞，去嘗試過往不曾有過的想象、去攀登過往不曾達到的峰頂。頂尖AI科學家李飛飛宣稱AI的勝利不能僅僅是科學的勝利，而必須是人文的勝利，這意味著AI需要成為「遵循優良的學術傳統，願意協作，尊重他人的意見與專業的機器」，這亦為人類文明的作業系統築起了一道倚重AI革新且可持續發展的防火墻。

作者：花暉

文：花暉（上海交通大學媒體與傳播學院副教授）圖：均由AI作圖，作者提供編輯：周敏嫻責任編輯：邵嶺

轉載此文請註明出處。