文生影片大模型Sora 是 Open AI 推出的, 可以透過文字描述直接生成高度擬真的影片。
Sora能夠根據使用者的一句話生成長達一分鐘的影片, 且影片流暢度和穩定性皆在水準之上。
目前官網上已經更新了48個影片demo, 在這些demo中, Sora不僅能準確呈現細節, 還能理解物體在物理世界中的存在, 並生成具有豐富情感的角色。 該模型還可以根據提示、 靜止影像甚至填補現有影片中的缺失幀來生成影片。
看了這些 Demo 確實是非常驚艷, 但是, 現階段還沒有開放給公眾使用者, 得在 X 上給柯曼提一段 prompt, 然後柯曼選擇釋出相應的影片。
據說Sora的基礎論文是由紐約大學助理教授謝賽寧撰寫的擴散Transformer論文, 背後生成的是不是Unreal 5 這樣的虛擬現實引擎, 還是機器學習創造的, 影片內容有沒有經過渲染?
我這幾年也關註了高科技的一些分行業公司, 多年前 Magic Leap 在體育館中, 群眾圍觀鯨魚從地板上躍出騰空再消失也是頗為驚艷, 但最終被揭穿只是為了融資拍攝的宣傳片。 蘋果從 2020 年就在傳的 Apple glasses, 最終在跳票多年後出的是這麽個頭罩式的 Vision Pro。
Bad blood 的霍爾姆斯宣稱的一滴血檢測疾病,
最後發現是買了西門子的血液檢測儀器在後面使用。
在她十多年的未被揭穿的過程中可是被譽為女版喬布斯,
Theranos 也是匯聚了眾多大咖投資月台。
Sora的釋出也趕在了OpenAI正在融資的節骨眼上。
高科技公司本身的技術門檻就很高,
又是開創性的工作,
顛覆現有社會的認知,
驗真和證偽都非常難,
需要時間,
還是讓子彈再飛一會。
據說 8 月份對外開放,
等那個時候再來震驚,
激動,
焦慮,
夜不能寐吧。