該死的sora搞得我整晚失眠

2024-02-18科技

最近怎麽樣，朋友們？今天我來給大家介紹一個讓我整夜失眠的東西——OpenAI剛剛釋出的文生影片大模型，Sora。真的，這件事讓我有種「現實，不存在了」的錯覺。看到Sora的能力，我不由自主地想到了【三體】裏的一句話：「物理學，不存在了」。不過在這裏，我們得換一種說法：「現實，不存在了」。

Sora：現實與虛擬的交匯點

首先得承認，Sora不是簡單的AI模型。它代表了OpenAI在將AI教會理解並模擬運動中的物理世界方面的一個巨大突破。目標是訓練出可以幫助人們解決需要與現實世界互動的問題的模型。想象一下，這意味著什麽？它意味著AI現在不僅能理解靜態的影像，還能夠理解和生成動態的影片內容。簡直就像是給了AI一雙能看見時間流動的眼睛。

Sora的強大之處

接下來，讓我們來聊聊Sora的三個超級能力：「60秒超長長度」、「單影片多角度鏡頭」和「世界模型」。

首先，當大部份AI影片還在為了四秒連貫性掙紮時，Sora傲嬌地宣布：60秒的影片？對我來說，小菜一碟！

然後，你以為影片制作中最困難的多角度鏡頭轉換是問題？對Sora來說，也不過是左手的事情。

而最讓我震撼的是，Sora的「世界模型」——它甚至能在影片中展現出對物理規律的理解！

技術背景解析

Sora的強大並非無中生有。它是一種擴散模型，能夠透過從靜態雜訊出發，逐步移除雜訊來生成影片。與GPT模型類似，Sora使用了變壓器架構，提供了卓越的擴充套件效能。它透過將影片和影像表示為數據塊（或稱為「修補程式」），這些修補程式類似於GPT中的token，這種統一的數據表示方式使得Sora能夠訓練在更廣泛的視覺數據上，涵蓋不同的持續時間、分辨率和長寬比。簡而言之，Sora就是將我們熟悉的GPT帶入了影片的世界。

未來的可能

OpenAI表示，他們在讓Sora投入使用前會采取一系列重要的安全措施。包括與專家合作，使用檢測分類器幫助辨識誤導性內容，並在未來可能在OpenAI產品中部署模型時加入C2PA後設資料。這意味著Sora不僅是技術上的一大步，也是在負責任地推進AI技術的同時，考慮到了安全性和倫理性的又一大步。

結語：未來已來，你準備好了嗎？

最後，Sora不僅僅是一個技術產品，它也是對現實和虛擬界限的一次深刻探索。透過它，我們能夠預見到一個在虛擬世界中自由創造和探索的未來。雖然我們無法預測人們將如何使用或濫用這項技術，但正如OpenAI所說，從真實世界中學習是創造和釋出越來越安全的AI系統的關鍵組成部份。

所以，當現實和虛擬開始模糊的時候，你準備好迎接這個新世界了嗎？讓我們一起期待Sora為我們開啟的無限可能吧！