當前位置: 華文世界 > 科技

關於 Sora 的另一些思考

2024-02-18科技

文生影片大模型Sora 是 Open AI 推出的, 可以透過文字描述直接生成高度擬真的影片。

Sora能夠根據使用者的一句話生成長達一分鐘的影片, 且影片流暢度和穩定性皆在水準之上。

目前官網上已經更新了48個影片demo, 在這些demo中, Sora不僅能準確呈現細節, 還能理解物體在物理世界中的存在, 並生成具有豐富情感的角色。 該模型還可以根據提示、 靜止影像甚至填補現有影片中的缺失幀來生成影片。

看了這些 Demo 確實是非常驚艷, 但是, 現階段還沒有開放給公眾使用者, 得在 X 上給柯曼提一段 prompt, 然後柯曼選擇釋出相應的影片。

據說Sora的基礎論文是由紐約大學助理教授謝賽寧撰寫的擴散Transformer論文, 背後生成的是不是Unreal 5 這樣的虛擬現實引擎, 還是機器學習創造的, 影片內容有沒有經過渲染?

我這幾年也關註了高科技的一些分行業公司, 多年前 Magic Leap 在體育館中, 群眾圍觀鯨魚從地板上躍出騰空再消失也是頗為驚艷, 但最終被揭穿只是為了融資拍攝的宣傳片。 蘋果從 2020 年就在傳的 Apple glasses, 最終在跳票多年後出的是這麽個頭罩式的 Vision Pro。

Bad blood 的霍爾姆斯宣稱的一滴血檢測疾病, 最後發現是買了西門子的血液檢測儀器在後面使用。 在她十多年的未被揭穿的過程中可是被譽為女版喬布斯, Theranos 也是匯聚了眾多大咖投資月台。
Sora的釋出也趕在了OpenAI正在融資的節骨眼上。
高科技公司本身的技術門檻就很高, 又是開創性的工作, 顛覆現有社會的認知, 驗真和證偽都非常難, 需要時間, 還是讓子彈再飛一會。 據說 8 月份對外開放, 等那個時候再來震驚, 激動, 焦慮, 夜不能寐吧。