關於 Sora 的另一些思考

2024-02-18科技

文生影片大模型Sora 是 Open AI 推出的，可以透過文字描述直接生成高度擬真的影片。

Sora能夠根據使用者的一句話生成長達一分鐘的影片，且影片流暢度和穩定性皆在水準之上。

目前官網上已經更新了48個影片demo，在這些demo中， Sora不僅能準確呈現細節，還能理解物體在物理世界中的存在，並生成具有豐富情感的角色。該模型還可以根據提示、靜止影像甚至填補現有影片中的缺失幀來生成影片。

看了這些 Demo 確實是非常驚艷，但是，現階段還沒有開放給公眾使用者，得在 X 上給柯曼提一段 prompt，然後柯曼選擇釋出相應的影片。

據說Sora的基礎論文是由紐約大學助理教授謝賽寧撰寫的擴散Transformer論文，背後生成的是不是Unreal 5 這樣的虛擬現實引擎，還是機器學習創造的，影片內容有沒有經過渲染？

我這幾年也關註了高科技的一些分行業公司，多年前 Magic Leap 在體育館中，群眾圍觀鯨魚從地板上躍出騰空再消失也是頗為驚艷，但最終被揭穿只是為了融資拍攝的宣傳片。蘋果從 2020 年就在傳的 Apple glasses，最終在跳票多年後出的是這麽個頭罩式的 Vision Pro。

Bad blood 的霍爾姆斯宣稱的一滴血檢測疾病，最後發現是買了西門子的血液檢測儀器在後面使用。在她十多年的未被揭穿的過程中可是被譽為女版喬布斯， Theranos 也是匯聚了眾多大咖投資月台。
Sora的釋出也趕在了OpenAI正在融資的節骨眼上。
高科技公司本身的技術門檻就很高，又是開創性的工作，顛覆現有社會的認知，驗真和證偽都非常難，需要時間，還是讓子彈再飛一會。據說 8 月份對外開放，等那個時候再來震驚，激動，焦慮，夜不能寐吧。