當前位置: 華文世界 > 科技

又一神作:OpenAI引領科技革命,視覺化文本制作利器Sora問世!

2024-02-17科技

昨日,全球知名機構OpenAI推出了一款顛覆性的新產品——影片文字生成工具Sora。該產品整合了視覺化轉換器及傳播模型,足以應對復雜場景,如電影特效、影片編輯等。此項成果無疑為人工智能產業發展帶來了新的突破口。

OpenAI公司自成立以來,就始終致力於推動人工智能技術的發展。此次推出的新晉產品Sora,就展示了該公司強大的科技實力。據了解,Sora是由視覺轉換器(ViT)和傳播模型有機結合而成,具備強大的視覺化文書處理功能。

據悉,這一突破性的成果源自於技術團隊長年的研究積累和創新精神。透過將影片片段嵌入「修補程式」式潛在空間,並視其為一個個「標記」,Sora實作了影片資訊的高效轉化和處理。

OpenAI官方網誌對此作了深入解釋:Sora是一款擴散模型,它能夠根據輸入的有噪修補程式(含環境提示),對原生的「純凈」修補程式進行準確推斷。值得一提的是,Sora還可以接受圖片輸入實施圖片生成、編輯等操作。同時,借助影片輸入,Sora亦可實作精準的影片編輯。

然而,Sora最為突出的優勢在於其高度真實的物理世界模擬能力(OpenAI團隊稱之為「新興模擬能力」)。這一特質使其超越了至今尚未出現的同類文字影片模型。盡管谷歌最近推出的Lumiere模型獲得了認可,但與Sora相比,仍顯遜色。

雖然坊間有言論稱神經輻射場(NeRFs)可能在幕後發揮作用,但對此只有捕風捉影的線索,缺乏確鑿證據。然而,專業人士推測,數據多樣性可能在生成過程中啟用更深層次的效能,這是大型模型經常展現的現象。

值得註意的是,對於競爭對手Pika和Runway ML的消亡報道,業內人士指出,這些結論都是誇張的。在新型技術叠代飛速的如今,未來充滿無限驚喜。因此,更重要的是要取得使用者體驗的勝利。雖然目前還未在影片領域建立起廣泛套用,但是信心滿滿的Midjourney正在透過Discord吸引使用者。

總結來說,Sora的誕生是人類在人工智能領域跨越的又一次裏程碑,其超凡的影像處理能力進一步拓展了人工智能的套用邊界。展望未來,隨著更多企業加入到人工智能的研發和套用之中,必將創造出更加豐富的經濟社會價值。

而隨Sora的出現,OpenAI的領導地位進一步得到鞏固,更引人深思的是,這家頭部AI企業的背後可能還藏著一個又一個可怕的,能改變世界生產力的工具!

而AI突破的背後,算力的競爭也將對全球科技企業的競爭格局帶來巨大變化!

得算力者得天下!