當前位置: 華文世界 > 科技

花暉|當AI入侵藝術創作的作業系統

2024-07-13科技
「人工智能已入侵人類文明的作業系統。」這是【人類簡史】作者尤瓦爾·赫拉利對於AI叠代之迅猛而發出的感嘆及憂慮。赫氏素來以演化生物學的角度闡釋人類歷史,當過往的「AI威脅論」集中於智慧機器奴役或滅絕人類,赫氏則認為今天的AI具備了操縱及生成語言的非凡能力,出現「會講故事的電腦」無疑將成為人類史的一個拐點。
考察AI藝術創作領域,這種「入侵作業系統」的狀態已初現端倪且迅速蔓延,那麽機器語言將如何影響人類的創作思維及美學表達?在人機互動的系統框架中,各自又將扮演怎樣的角色?
詞元生萬物是語言的前進演化還是退化
赫拉利認為語言是人類文明的基本要素,而正是透過改變語言表達的習慣與構成,AI得以「操縱」人類觀察及思考的方式。換言之,「矽基生命」正嘗試從根本上瓦解並重塑最頂端碳基生命的文明累積系統。
赫氏的一系列觀點顯然將AI視為入侵物種而懷有「敵意」,但由語言這個極為重要的符號系統出發,思考AI與人類文明的現時及未來關系,確是一條新穎而有效的路徑。不妨由「提示詞」開始我們的討論。
但凡對AIGC稍有接觸,便不會對文生圖、文生影片感到陌生。想象一下在文本框內輸入蒙娜麗莎、立體主義兩則提示,AI送出的極大可能是畢加索版的神秘微笑,你當然還能額外獲得波普版、水墨版乃至黏土版。文本驅動是AI創作的最基本形式,由此看來,AI對人類最直觀的「操縱」在於那些連續的、高度依賴上下文的語意表達,由斷裂、跳躍的語素、詞、熟語等語言單位直接完成了,且完成的形式在情境的邏輯性、完整性上日趨合理,並越來越清晰地展現出一種機器創意。這就導致一個悲喜難辨的結果:當我們將語意表達的概念拓展至藝術創作,過往那些引以為豪的豐富經驗、刻苦訓練、入微觀察、情緒峰值,都在體量盡可能縮小的音義結合體面前,顯得性價比很低。隨著提示詞工程師成為職場新寵、9塊9的AIGC課程充斥網絡,人工智能顯然帶來了「6·18」般的創作狂歡。
那麽回到語言的討論範疇,基於提示詞的「作業系統」究竟是一種前進演化還是退化?
在AIGC的語言模型中,「詞元」這一轉譯代表著機器以數碼形式來讀懂人類詞句的最小語意單位。提示詞中的長文本經由「分詞」步驟拆解為詞元,並透過嵌入、位置編碼等一系列處理,由物理世界的非結構化數據轉為機器可理解的結構化向量,圖片、影片等多模態輸入的最終目的地也便是多維向量。
暫不展開復雜的技術機理,而用螞蟻搬家的故事來理解一下詞元的無窮力量。一只螞蟻承載負重、兜兜轉轉大半天回到蟻穴,而當成千上百集體遷移時,卻能驚人地依據地形選擇出最便捷、最合理的行進路線,路遇急流亦會抱作一團滾入河中,透過犧牲少數邊緣個體而獲得蟻群的勝利。這種整體大於部份之和的智能爆發被理論生物學家Beta朗菲稱為「湧現」,而一旦突破聚合的奇異點,宇宙起源與生命演化都在湧現之列。
詞元就像一只螞蟻,當我們投餵足夠多的語料給大語言模型後,由表及裏湧現而出的是AI對於提示詞中潛藏的藝術風格及情感傾向,產生了辨識、理解以及「想象」——假設我們意欲為「一鍵生成」添加一些擬人的色彩。同時於規模法則之下,隨著模型尺度急劇增大,其計算精準度呈現出昂然上揚的冪律曲線。正如OpenAI從未將Sora簡單地等同於影片模型,而是野心勃勃地稱其為「世界模擬器」,當你察覺到墨鏡女郎鏡片上的反光時,囈境與現實間的界線似乎並不那麽重要了。
表面上看,多模態提示詞代表著創作界面的全然改頭換面,而背後的詞元生萬物,體現出機器對藝術世界新一階段的理解與掌握,更是人類在新一階段對藝術思維的形成與表達、創作工藝的更新與再造產生了顛覆舊知的認識與行動。
一個有趣的例子是前不久全球首部AI長片【我們的終結者2重制版】上映,故事背景設定為ChatGPT一統天下的未來世界,OpenAI派遣機器人穿越時空刺殺人類反抗軍領袖山姆·柯曼,也即是現實中OpenAI的創始人,整體情節與經典科幻片【終結者2】形成了呼應。撇開影片中部份影像細節的不到位,其制作本身便掀開了電影工業的新篇章。專案啟動於好萊塢編劇大罷工之際,在傳統電影技術崗位缺失的前提下,50名AI藝術家利用ChatGPT、Midjourney、Runway等五花八門的AI工具,完成了50個彰顯個人風格及工具特性的影像片段,整部長片由此「拼湊」而成。這樣的「草台班子」在3個月內完成了編劇、導演、場記、美術、配樂等所有標準工業流程,證明了AI在降低使用門檻的同時,帶來了跨學科、跨門類的通用智慧。
若將語言範疇由藝術創作的技法與規律,再度拓展至認識宇宙世界的執行真理,這種通用智慧則更令人驚嘆。Deep Mind旗下的AlphaFold於數年前,已預測出100萬個物種超過2億個蛋白質的結構,幾近涵蓋地球上所有的已知蛋白質,而今天的AlphaFold 3已將預測範圍擴充套件到了更為廣泛的生物分子。顯然AI在各個領域對於幫助人類認識自身,發揮著日益積極的作用,那麽人類又該如何可持續性地與AI相處?
從逆向圖靈測試到人文的勝利
近日一位AI獨立開發者設計了一項別出心裁的遊戲,將亞里士多德、莫札特、達·芬奇、克利奧帕特拉、成吉思汗五位「角色」設定於AI世界的一節車廂中,其中只有一位是人類,其它幾位均為GPT、Claude、Gemini等頭部引擎驅動的AI玩家,五人間透過互相問答,並以投票形式決出誰是混入的異類。人類扮演的角色最終被四位AI玩家中的三位以缺乏領導力與戰略思維為由,判定為非我族類。
若熟知70多年前的圖靈測試,此次由機器檢驗人類的反向實驗便顯得格外有趣且有深意。在愈來愈緊密的人機系統中,如何與AI相處,便成了一個需要回答的問題。
在現時的答案中,過往的「工具論」顯然不合時宜,AI不再是輔助導演完成分鏡、幫設計師生成草圖的簡單機器,一種相互補充與激勵的「友伴論」是良好的起點,正如跳躍的提示詞,將由AI填補創作的空間。又一個值得一提的案例是由商湯科技、上海人工智能實驗室參與研發的首個人體動捕大模型SMPLer-X。得益於450萬個例項的數據訓練,樣本影片中人體姿態的多樣性、局部動作的復雜性,都能被快速且高質素地辨識並提取出來,這意味著CG制作展現出了一種嶄新的未來。
由1937年【白雪公主和七個小矮人】、1941年【鐵扇公主】啟用轉描技術算起,逐幀摹繪、慣性測量、光學動捕等一系列方法都離不開巨大的人力物力,而AI生成式動捕擺脫一切傳感器,由網絡攝影機、手機乃至網絡影片中直接采集獲取動作數據,在大幅削減成本的同時,著實降低了制作人員的工作難度與強度。
在這樣的創作友伴關系中,藝術家們理應受到鼓舞,去嘗試過往不曾有過的想象、去攀登過往不曾達到的峰頂。頂尖AI科學家李飛飛宣稱AI的勝利不能僅僅是科學的勝利,而必須是人文的勝利,這意味著AI需要成為「遵循優良的學術傳統,願意協作,尊重他人的意見與專業的機器」,這亦為人類文明的作業系統築起了一道倚重AI革新且可持續發展的防火墻。
作者:花暉
文:花暉(上海交通大學媒體與傳播學院副教授)圖:均由AI作圖,作者提供編輯:周敏嫻責任編輯:邵嶺
轉載此文請註明出處。