本報記者 郭冀川 丁蓉
繼ChatGPT這一現象級的套用推出一年之後,近日,美國開放人工智慧研究中心OpenAI正式釋出了旗下首款視訊生成模型Sora,再次在全球掀起了人工智慧關註浪潮。相較於此前的視訊生成模型,Sora在底層模型和演算法上進行了創新,被業界稱為視訊生成領域的裏程碑。因此,Sora的問世令世人驚呼:現實不存在了!
從自動生成文字到自動生成圖片,再到現如今自動生成視訊,人工智慧大模型技術在加速叠代。中央財經大學數位經濟融合創新開發中心主任陳端在接受【證券日報】記者采訪時表示:「人工智慧技術的國際競爭,本質上是國家創新力、創新生態以及創新資源體系的全方位競爭。國內人工智慧相關企業擁有龐大的市場需求和豐富的數據資源等優勢,正緊抓時間視窗,加強國際交流與合作,加快技術創新和商業化步伐,創造更多套用與成果。全球人工智慧產業正進入加速發展階段。」
為什麽Sora引發關註潮?
Sora作為文字轉視訊模型,能夠嚴格根據使用者輸入的提示詞、文本指令或靜態影像,生成長達1分鐘的視訊,保持較高的視覺品質。據OpenAI官網介紹,該公司正在努力教人工智慧「理解和模擬處在運動當中的物理世界」。
國海證券2月18日釋出研報認為,Sora體現出大模型前進演化速度的超預期。截至2023年12月份,ChatGPT使用者數1.8億,網站月均存取量17億次,OpenAI估值超1000億美元,Sora的釋出將開啟OpenAI使用者量價和估值空間。
據悉,Sora相較於過去幾款主流文生視訊工具有了極大振幅的提升。華金證券分析師方聞千表示,Sora生成的視訊具有超長時長、世界模型、多鏡頭切換三大特點。具體來看,之前幾款主流模型生成的視訊時長僅在20秒以內,Sora不僅能夠深入理解使用者提示,還學會了物理世界的部份規律,比如:一個人吃漢堡後會留下咬痕、火車車窗上會產生逼真的倒影,Sora還可在單個視訊中設計出多個鏡頭。
繼文字生成和影像生成技術之後,Sora是視訊生成技術方面的突破性進展。短期來看,Sora將直接改變很多內容產業的成本結構以及資源支撐體系。薩摩耶雲科技集團首席經濟學家鄭磊向【證券日報】記者表示:「Sora的誕生將對影視、廣告、教育、遊戲等多個行業產生直接影響。例如,視訊創作者可以專註於更具創意性和戰略性的工作,而將繁瑣的重復性工作交給人工智慧。」
陳端表示:「長期來看,Sora將遠遠不止是內容生產工具,其構建的基於三維物理世界來創造數位原生世界的強大引擎,將給一些產業從底層工具層面帶來變化,形成深遠影響。」360集團創始人、董事長周鴻祎2月16日在其微博上表示,Sora意味著AGI(人工通用智慧)實作將從10年縮短到1年。
不過,目前的Sora仍存在一定局限性。例如,它可能難以精確模擬復雜場景的物理狀況,也可能無法理解一些特定的因果和時間聯系等。此外,模型還可能混淆一些文本指令中的空間細節,例如左右方向等。據了解,相關領域專家將對模型展開測試,目前,該模型只向有限數量的創作者提供存取許可權。
中國資訊協會常務理事、國研新經濟研究院創始院長朱克力向【證券日報】記者表示:「要用好Sora,企業首先需深入了解其技術特性和套用場景,其次要積極探索Sora與其他技術的結合,如與虛擬現實、增強現實等技術的融合套用。同時,還應註意數據安全和私密保護等問題。」
多家上市公司涉足相關領域
2023年,科技大廠、創業企業、科研院所等紛紛入局AI大模型,目前,中國大數據、雲端運算、人工智慧企業創新發展,數位產業化體系逐漸完備,並向全球產業鏈中高端躍進。政策端,【生成式人工智慧服務管理暫行辦法】【關於加快推進視聽電子產業高品質發展的指導意見】等陸續出台,既促進了人工智慧大模型技術的創新發展和生成式人工智慧產業健康發展,也進一步規範制度引領技術落地。
今年春節期間,支付寶等平台陸續推出了人工智慧全家福照片制作功能,上傳家人照片可以生成不同風格背景的全家福照片,生成式人工智慧工具在圖生圖領域的落地套用已經被公眾廣泛接納。
在視訊生成領域,公開資訊顯示,已有海康威視、佳都科技、昆侖萬維、大華股份、螢石網路、萬興科技、因賽集團、拓爾思、當虹科技等多家A股上市公司積極布局。
例如,佳都科技公布了其自主研發的國產化的大模型技術,聚焦在交通、城市治理、政務服務等垂直領域的套用,公司的TransCore-M多模態大模型能夠理解文本、影像、視訊等多種模態的資訊,並且按照使用者需求將其描述、提示或轉化為指令程式碼,是個「聰明」的交通資訊小助手。
當虹科技擁有自研的生成式人工智慧工具集,於2023年上半年釋出了以靜態照片生成三維體積視訊的方案,支持六自由度視角自由移動,並且透過點雲模型轉換及壓縮演算法實作高達800倍的視覺無失真壓縮,實作不同模態之間相互切換。
中國在人工智慧技術和大模型領域已經取得了顯著的進展,但與國際領先水平相比,仍存在一些短板。中國電子商務專家服務中心副主任、資深人工智慧專家郭濤在接受【證券日報】記者采訪時表示:「這些短板包括原創演算法的研發、高品質數據集的構建、芯片和硬體的自主研發能力、國際化人才的吸引和培養等方面。」
中國行動通訊聯合會區塊鏈與數據要素專業委員會主任委員、首席數位經濟學家陳曉華表示,近年來,中國相關政策對人工智慧技術套用和大模型的技術研發和產業創新提供了良好環境,但由於前期投入不足,在基礎研究和核心演算法的原始創新上還有差距。
陳曉華說:「人工智慧革命將會推動算力基礎設施的需求猛增,此外文生視訊大模型將帶動視訊數據的呼叫規模持續放大,這對寬頻品質也提出了更高的要求。」
商務部研究院電子商務研究所副研究員洪勇向【證券日報】記者表示:「國際上,部份大型科技公司憑借雄厚的技術積累和資源在人工智慧賽道占據領先地位。中國企業在某些細分領域已具備國際競爭力,但仍有短板。當下需要清醒意識到差距,加強基礎科研、培養高層次人才、建立合規體系,並積極參與國際合作與競爭,進一步提升在全球人工智慧領域的地位。」
圖片 | 站酷海洛
制作 | 周文睿