當前位置: 華文世界 > 科技

OpenAI再爆火,專家解析:Sora並不會讓現實不復存在

2024-02-18科技

潮新聞客戶端 記者 朱高祥

不管你是否關註AI領域,相信最近都被OpenAI的開年新「王炸」Sora刷屏了朋友圈。

2月16日,曾因ChatGPT一炮而紅的OpenAI宣布推出全新的生成式人工智慧模型「Sora」。僅僅透過一段文本指令,Sora可以直接輸出長達60秒的視訊,並且包含高度細致的背景、復雜得多角度鏡頭,以及富有情感的多個角色。

OpenAI表示Sora能夠生成復雜的場景,不僅包括多個角色,還有特定的動作型別,以及對物件和背景的準確細節描繪。面對如此驚人的表現,連馬斯克也感嘆:「人類認賭服輸。」

Sora橫空出世,人人可做導演?

在官網上,OpenAI公布了多段演示視訊,都頗為驚艷。

比如,「一位時尚女性走在充滿溫暖霓虹燈和動畫城市標牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包。她戴著太陽鏡,塗著紅色口紅。她走路自信又隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去」。

根據這段提示詞,Sora生成了一段60秒的視訊,不僅還原了文字內容,人物、背景、光影效果的精細程度都足以以假亂真。

△Sora生成的視訊

360創始人周鴻祎對Sora給予了極高的評價,他認為,Sora的誕生意味著AGI(通用人工智慧)實作可能從10年縮短至一兩年。

在知乎上,有數媒專業的學生面對Sora發出「何去何從」的感嘆。甚至有人稱,Sora出現後,「現實不復存在」。

浙江大學人工智慧研究所所長吳飛告訴潮新聞記者,Sora確實給人比較大的驚喜,比如在長時間內保持內容合理性。目前才1分鐘,未來可能會出現更長、更符合世界規律、更有情節、更有情感等的視訊。Sora除了合成長時間自然視訊這一亮麗成果外,所合成的內容與物理世界規律保持一致,即不會出現違反世界客觀規律的視覺資訊,因為這一緣故Sora被一些自媒體稱為物理世界的繪制引擎,即客觀世界模擬器。

工信部資訊通訊經濟專家委員會委員、數位經濟專家劉興亮稱,AI生成的視訊可能減少了對人類演員、導演和其他創意角色的需求,從而影響到這個行業的就業。此外,隨著AI技術的進步,傳統的影視制作流程和商業模式也可能面臨重塑。

「Sora將重塑影視創作等行業的遊戲規則,以文生視訊模式顛覆電影創作過程,可能今後會有若幹人透過AIGC相關技術來生成電影。」吳飛也認為。但他指出,「說Sora出現後,現實不復存在,就有些忽悠了。」吳飛表示,客觀而言,Sora很難將物理世界中牛頓定律、亂流運動方程式和量子學定理等規律一條一條在模型中顯式羅列實作,而是透過對海量數據學習來隱式表達客觀規律,這或許是來自於神經網路模型的湧現之力。

吳飛解釋稱,Sora目前合成的視訊中,還是有違反現實規律的,如漂浮的椅子,籃球穿過球框,狼的數量忽多忽少等。

△Sora生成的視訊

「我們距離AGI還差得遠」

由於Sora的驚艷表現,很多人再次發問,我們離通用人工智慧還有多遠?

一般認為,通用人工智慧(Artificial General Intelligence,簡稱AGI)是指擁有與人類相當甚至超過人類智慧的人工智慧型別。通用人工智慧不僅能像人類一樣進行感知、理解、學習和推理等基礎思維能力,還能在不同領域靈活套用、快速學習和創造性思考。

「不過,我們實際上現在還無法清楚定義通用人工智慧,AGI這個詞並不能隨便用,更不要談我們離通用人工智慧還有多遠。」所謂的AGI,應該是機器的自然語言的互動能力。他暢想的AI的未來,是像人一樣的AI。「但是由於人類對自己如何產生意識、形成各種能力都無法理解,因此目前奢望像人一樣的AI就是幻想了。更切合實際,是希望AI能夠幫助人類完成任務,比如電影創作。」吳飛說。

△Sora生成的視訊

浙大研究院人工智慧中心副主任趙俊博在朋友圈裏發文表示:「反對很多自媒體把這個技術類比在 AGI 上面,我們距離AGI還差得遠。……我覺得一個世界模型需要有能力去輸出動作,輸出對未來的預測,輸出對當前所處狀態的判斷。Sora大機率是學到了一些世界運轉的模式,但是是否具備其他上述能力我們不知道。」

吳飛告訴記者,目前國內相關行業仍有短板,不僅是在大模型上,還體現在算力上,「算力是AI的基礎」。

當地時間2月17日,軟銀集團的創始人孫正義計劃籌集1000億美元(當前約合人民幣7210億元)成立一家AI芯片公司。如果該計畫成功,其將成為自OpenAI旗下聊天機器人ChatGPT問世以來AI領域金額最大的投資之一,遠超過微軟近年來對OpenAI總計或達130美元的投資。

另有外媒報道稱,OpenAI的CEO山姆·阿特曼(Sam Altman)正在從中東地區籌集總計高達7萬億美元的資金,以支持公司的一項半導體計劃,並與輝達展開競爭。

「這些都是為了支持AI研究,大模型需要非常大的算力,比如ChatGPT有1750億參數,要訓練出來就需要大算力。」吳飛稱。

「轉載請註明出處」