當前位置: 華文世界 > 科技

Sora:不只是視訊顛覆者,更是虛擬世界模擬器的奇跡!

2024-02-17科技

今年的第一波炸裂

不止如此。

- 1 -

這幾天,大家都在聊OpenAI的Sora,認為它不止會顛覆視訊行業,甚至可能成為世界模擬器,讓人類離真正進入 真實的 虛擬世界又近了一步。

沒錯,但很多人忽略了一個細節。

OpenAI的CEO 阿特曼寫了一段文字,然後 S o ra就生成了這段60秒的視訊,驚艷眾人:

這段60秒一鏡到底的視訊,女主角、背景人物,都達到了驚人的一致性,各種鏡頭隨意切換,人物都是保持了神一般的穩定性。

跟以往大模型表現出來差強人意的效果完全不一樣。

業內人士分析,這是技術路線的徹底改變:

以往大模型生成視訊是先畫影像,1秒鐘24幀就畫24張圖拼接起來,60秒的視訊需要畫1440張圖片,一千多張圖片拼接在一起,很容易出現細節崩掉,或者閃爍的問題。

但是Sora應該是采用了遊戲引擎的方式,換句話說,AI學會了使用工具,透過大量的數據訓練,借助 遊戲 引擎來建模和渲染, 對真實世界和虛構世界進行模擬,這不止是避免了 AI繪畫 模型的弊端:

簡直可以稱為虛擬世界模擬器

顛覆視訊行業太小兒科了,想象一下,配合VR或者AR裝置,借助Sora大模型,打個比方,把Sora搭載到 Apple Vision 眼鏡上,然後隨便說一句話,馬上身臨其境,再配合一些穿戴式的感知傳感器裝置,這不就是美劇【 西部世界 】嗎?

按照目前的技術發展,十年內實作商用應該不是難事,快的話可能5年就進入市場了。

- 2 -

說完了Sora和暢想,來說一下大家都忽略的細節。

遊戲。

這次 OpenA I Sora上分又是因為遊戲,使用了遊戲引擎,直接讓文字生產視訊的技術向前邁進了關鍵性的一大步。

但為什麽說是又?

大家知道的是,遊戲的發展推動了硬體的極大提升,不管是輝達還是AMD都在圖形處理上獲得巨大成功。

但很多人不知道,其實遊戲在軟體上也極大推動了技術進步。

比如 ChatGPT 的誕生,就得到過遊戲很大的助力。

當時OpenAI已經解決了AI的學習能力,但是 AI 的處理和互動能力還是很弱,於是就想到讓當時世界上最流行的對戰遊戲Dota2來充當AI的訓練場。

相較於之前的西洋棋和圍棋,Dota2的規則更復雜、要素 眾多、環境 多變。

當時OpenAI的大模型每天要打人類180年的Dota2,透過不斷自我對戰來提升處理復雜環境的能力,然後修正大模型參數。

最後,一共打了45000年人類時間的Dota2之後,OpenAI的大模型從1V1到5V5都戰勝了人類最強的玩家,從而也訓練出領先的神經網路技術,理解資訊的能力越來越接近人類,而處理資訊的效率顯然遠超人類。

這之後,GPT才 橫空出世, 在眾多的資訊大模型之中一騎絕塵,遊戲確實功不可沒。

- 3 -

結語

為什麽要提遊戲呢?

因為在很多地方,是把遊戲作為電子鴉片來看待的,不但談之色變,動輒 錘子伺候。

但現實是,遊戲在當今最領先的技術領域,其實發揮了關鍵性的作用。

這是要為遊戲正名嗎?不是電子鴉片,而是數位經濟的支柱產業?

也不是。

其實想說的是:

技術的進步需要適當的引導,但這種引導主要還是在套用階段,技術的萌發階段其實是需要相對寬松的生態和環境來自我孕育的。

這也是從0-1和從1-N不同的地方。

目前看起來,從1-N我們是沒有敵手,但是從0-1還有不小差距。

怎麽縮短差距?

希望OpenAI和遊戲的兩個成功例子,可以提供一些思路和啟示。

就這樣。