當前位置: 華文世界 > 科學

復旦傳播學教授鄧建國:Sora將開啟「世界建模使用者內容生產」時代

2024-03-01科學

文生影片大模型Sora的問世,引起了科技界、產業界和公眾的廣泛關註。傳播學專家如何看待Sora?它根據提示詞生成的影片是否將開啟一個新的傳媒時代?解放日報·上觀新聞記者近日采訪了復旦大學新聞學院傳播學系教授鄧建國。在他看來,這個人工智能大模型將開啟「世界建模UGC(使用者生產內容)」時代。

過去,用電腦技術為外部世界建立虛擬模型,只能由專業技術人員完成。Sora問世意味著,大眾只需輸入一些提示詞、幾句話,就能由大模型生成符合物理規律、展示外部世界動態變化的影片,即可完成「世界建模」。雖然它生成的影片還有不少瑕疵,如動物數量忽多忽少、椅子等固體會柔軟變形,但隨著技術叠代,人工智能的建模能力將日益提升,使虛擬影片「假作真時真亦假」。

大眾未來可自制「3D影片體驗包」

記者 :不少電腦科學家把Sora看作「世界模型」,因為它生成的影片符合這個世界的部份物理規律。您覺得「世界模型」作為媒體,未來將給我們的生活帶來什麽變化?

鄧建國 :「世界模型」可以創造源於現實世界、高於現實世界的「平行世界」。它們是fantasyland(夢幻世界),是wonderland(仙境),迪士尼樂園就屬於這類世界。

從古至今,給人帶來沈浸感體驗的「平行世界」有很多形式。比如,當我們走進敦煌洞窟,看到美輪美奐的壁畫,會感覺進入了另一個世界;走出洞窟後,我們會有一種眩暈感,這是從「平行世界」回到現實世界的生理反應。優秀的小說也能創造「平行世界」,讓讀者沈浸其中,比如【紅樓夢】和【魔戒】。電影誕生後,影院成為「平行世界」,觀眾看完一部精彩影片走出影院後,也會產生一種眩暈感,不知今夕何夕。對很多遊戲玩家來說,【反恐精英】【魔獸世界】【原神】就是他們的「平行世界」。

人類歷史上,創造「平行世界」往往需要投入很多智力、人力和財力。第三次工業革命後,電腦建模技術開始用於創造「平行世界」,但成本投入方面並沒有降低,這是一個資金、技術和勞動力密集型行業。然而Sora釋出後,歷史將要覆寫,因為世界建模技術實作了傻瓜化——人人都可以透過輸入提示詞,構建夢幻世界。

Sora生成的時尚女子漫步東京街頭短影片

從Sora生成的影片質素來看,今後大模型不僅能生成逼真的2D影片,也能生成更具有沈浸感的3D影片。未來,大眾可以自制「3D影片體驗包」,發送給朋友,或釋出在網絡平台上進行銷售,邀請他們進入自己創造的夢幻世界。

由此可見,我們將迎來「世界建模UGC」時代。這個時代會夷平技術鴻溝,使用者只要發揮想象力,就能便捷地創造出一個個「世界模型」。2002年前後,集中湧現的社交媒體使2D內容生產從PGC(專業生產內容)走向了UGC(使用者生產內容);2022年前後,集中湧現的人工智能將使3D內容的生產從PGC走向UGC。

人工智能向虛向實的兩個發展趨勢

記者 :您說的「平行世界」讓我想到了「元宇宙」這個詞,隨著Sora和蘋果頭顯器材Vision Pro的問世,一度被業界看好的「元宇宙」產業是否會興起?

鄧建國 :這是有可能的,因為Sora可以高效地生成「元宇宙」產業的內容產品,而蘋果頭顯器材是消費者體驗這些內容產品的硬件終端。蘋果行政總裁添·庫克說的「空間計算時代」,凸顯了二維互聯網的局限性,有了Vision Pro這類MR(混合現實)頭顯器材後,三維互聯網呼之欲出。它更有沈浸感,可以讓網民進入「元宇宙」,獲得身臨其境的體驗,並進行各種互動活動。

AIGC(生成式人工智能)是人工智能發展的一個趨勢,包括文生文字、文生音訊、文生圖和文生影片。這一趨勢正引導我們建構與現實世界共存和互動的虛擬世界,即「元宇宙」。人工智能發展的另一個趨勢是實體機器人,即具身智能。這體現為各種可穿戴式器材、自動駕駛、文生動作。

前一個趨勢是向虛擬發展,打造強大的人工大腦;後一個趨勢是向現實發展,讓人工大腦擁有能即時學習的矽基身體。兩者如雙螺旋一般相互促進,最終發展出與人類智能相似的人工智能,更好地滿足人類的各種需求。

Sora生成的龍年春節短影片

新聞工作者對Sora套用要審慎

記者 :請預測一下,文生影片大模型將對新聞傳播、影視等行業產生什麽影響?

鄧建國 :不妨把新聞傳播分開來看,在新聞行業中,我覺得Sora的套用前景不會很廣,而且對行業發展弊大於利,建議新聞工作者對文生影片大模型保持審慎態度。這是因為,新聞工作者的使命是透過采訪調查逼近真相,而Sora生成的影片以假亂真,是對真相的幹擾。我現在所能想到的它在新聞行業中的套用,是記者基於新聞事實再現沒有拍攝到的新聞現場。

人工智能目前對新聞行業只能起到輔助作用,例如記者利用ChatGPT收集相關材料。人工智能在快速發展,對新聞業的價值還有待觀察。新聞工作者應保持好奇心,不斷探索嘗試,爭取在明確事實與虛擬邊界的前提下,把AI調教成得力的助手。

而在傳播業中,例如廣告、行銷、影視等行業,Sora預計會帶來沖擊性影響。這些行業分工精細,包含舞美、化妝、道具、動畫特效等眾多環節。文生影片大模型出現後,雖然無法完全替代真人表演和實景拍攝,但有望大幅精簡影片制作環節。

以科幻電影為例,它包含兩大要素:一是宏大的景觀特效,二是富有想象力的故事。Sora用於景觀特效制作後,預計會節省大量時間、人力和資金成本。而在講好故事方面,仍然需要人類的想象力和創造力。

給文生影片大模型設提示詞禁區

記者 :文生影片大模型在給傳播業帶來重要影響的同時,也給人工智能「深度偽造」(Deepfake)提供了先進工具。近年來,利用AI技術偽造的照片和影片在網絡上流傳。Sora問世後,相關機構可采取什麽應對措施?

鄧建國 :如果一種媒介技術被大量用於違背公序良俗的用途,那麽這種技術和技術背後的公司很難活得長久,所以「技術向善」不僅僅是公眾和政府對科技企業的要求,也是科技企業為了長遠發展的內在需求。正因為認識到這一點,大型科技企業都會宣稱並采取一些措施,對自己研發的技術抑惡揚善。例如,OpenAI對其影像生成模型DALL-E采取的限制措施包括:禁止生成暴力、色情內容,禁止采用真人形象和已知藝術家的創作風格;在生成的圖片中嵌入程式碼,將它們與人工創作或拍攝的圖片區別開來。Sora向公眾開放後,估計OpenAI也會采取類似舉措。

政府部門在人工智能治理方面則要註意平衡,既不能讓新技術無規制地套用落地,也要避免過嚴的監管限制技術發展。在「風險偏好型」和「風險厭惡型」兩類技術治理政策間,我傾向於「風險偏好型」,人工智能治理要有一定的容錯空間。

欄目主編:黃海華 圖片來源:OpenAI

來源:作者:俞陶然