當前位置: 華文世界 > 科技

AI相關企業熱議Sora:市場機會異常龐大,要積極擁抱變化

2024-02-19科技
封面新聞記者 楊鑫 溫彥博 尚誌
Sora引發的人工智慧行業震動還在席卷世界。這個在2月16日淩晨,由OpenAI釋出的第一個文生視訊模型,可以用文字指令生成長達60秒的高畫質流暢視訊,在生成視訊長度、連貫性、多鏡頭切換方面具備顯著優勢,能力幾乎「碾壓」目前其他類似模型。
過去幾天時間裏,國內外科技、影視、社會等各界知名人士紛紛發表觀點,驚嘆技術的飛躍。驚訝之余,更多AI相關企業從業者開始尋找行業機會。封面新聞對話亞馬遜雲科技、考拉悠然、阿加犀科技、諦達諾科技、超有範兒科技、車包包、iFUN.COM等企業相關人士,他們怎麽看待Sora,又將怎麽辦?
怎麽看?「重要裏程碑事件」
「從目前Sora展現出來的能力來看,它可以成為理解和模擬現實世界的基礎,而這一能力必將是實作通用人工智慧的重要裏程碑。」成都阿加犀智慧科技有限公司CEO孫曉剛如是說。
成都考拉悠然科技有限公司CTO謝延認為,Sora模型提供了一種更加高效高品質的從自然語言到視訊的生產方式,OpenAI也許希望透過生成的視訊來模擬真實的世界,相比於之前的模型(GPT-4V,google gemini)在視覺生成方向大大地邁進了一步,持續為 AGI 的普及提供動力。但是這一切也只能算是一個新的開始,用模型理解真實的物理世界的工作才算剛剛起步。
孫曉剛也表示,在驚嘆Sora展現出的能力的同時,也應該看到背後巨大的成本:據業內資訊,OpenAI 每天生成約 1000 億個單詞,需要大量的 GPU進行訓練計算。高昂成本使得絕大多數企業難以與之競爭,但Sora所帶來的市場機會卻是異常龐大的。
成都超有範兒科技有限公司CEO範明從技術方面進行觀察,在他看來,單純從這項技術來說未來內容生產的成本將極大降低,目前國內的各大模型廠家也會不斷跟進這樣的技術棧的突破,這些都會對於視訊內容生成行業、數位孿生行業帶來較大的沖擊。
iFUN.COM 是一家 AI 演算法公司,發行了多款遊戲產品。 iFUN.COM 大中華區CEO王瑜認為,Sora的出現對遊戲行業是極大利好,能降低人力成本、加速遊戲生產,例如未來在CG畫面制作方面效率將大幅提高。不過她堅信人是不可替代的,「AI要具備遊戲導演思維還有很長的路要走。」如何讓Sora這類工具在遊戲行業垂直套用,是該企業的AI 研究院正在與國內外相關高校持續研究的課題。
亞馬遜雲科技人工智慧產品架構師李雪晴認為,Sora解決了目前主流模型常見的一些難以商業化的技術點,比如一致性,時序性等等,但也仍然有一些不足,比如對於真實物理作用的理解和生成。由此Sora的釋出得到了各行各業的廣泛關註,也帶來了機會。
在李雪晴看來,Sora背後的機會有四,一是提供了一條在文生視訊領域新的技術路徑;二是Sora給予了使用者在更多行業場景的想象空間;三是相關模態的想象空間也隨之擴大,例如語音,3D等;四是人才,數據,算力三位一體打造了多模態領域的湧現能力,三者缺一不可。
怎麽辦?「積極擁抱變化」
謝延認為,Sora模型的誕生,毋庸置疑會進一步加速大模型技術的套用落地,在原有的場景下進一步提升想象空間,特別是結合場景的多模態能力套用,利用大模型技術重塑原有的使用場景、使用體驗,重塑產業鏈上下遊。從技術發展的角度來說,今年會加強對物理世界的感知,做好現實世界到虛擬世界的連線。
據介紹,考拉悠然一直專註於多模態領域的技術研究,2023 年 11 月就正式釋出了悠然多模態產業通用大模型,除了支持常見的NLP能力以外,在圖片、視訊理解方面提供業界領先的多模態理解能力。2024 年第一季度開始DT(diffusion transformer)模型的研究,目前已經具備初步的多模態生成能力,比如個人化圖片,tts 等。Sora 模型的誕生,也更加堅定了公司的戰略方向,預計在2024年第二季度推出真正的多模態理解和生成一體的產業模型,為企業客戶持續賦能,加速AI普惠化。
阿加犀是AI產業鏈上聚焦智慧物聯網邊緣計算的人工智慧企業,也扮演著大模型搬運工的角色。孫曉剛說,阿加犀提供的大模型邊緣端部署方案,一方面讓大模型推理擺脫了對雲端算力的依賴,不僅降低頻寬、算力和能耗成本,並且也進一步保障了使用者的私密安全;另一方面,AI要真正實作無處不在,它必將是邊緣端與雲端計算協同共存的。讓數據在更靠近終端使用者的邊緣端完成處理並輸出結果,是提升生產效率和生活體驗的有效手段和必由之路。
範明坦言,目前短期來看國內很難有廠家能夠超越Sora這樣大模型技術能力,「所以超有範兒這樣的技術研發和套用公司,更重要的是首先了解和熟悉一線大廠的大模型技術邏輯,然後在自己的領域中深挖套用落腳點,才能有機會突破和趕超。」
車包包(北京)聚合技術有限責任公司創始人王茂認為,「基於大模型開發商業套用才是效益最大的,而且日後最占據話語權的,也是這些有能力把AI 商業化落地套用的人。」結合車包包所從事的行業數智化能力,AI還是一種數位智慧化工具,可以理解為相應的行業有了一種「標準」。他表示,熱愛自己職業和工作的、有創造力的專業人士們反而更輕松了,不必把有限的精力用在其他所謂資源的競爭消耗上。
無獨有偶,李雪晴也認為,就像大語言模型一樣,不可能有一個模型做所有的事,事實上垂直領域的大模型和套用更具備商業價值。因此這實際上是對GenAI創業者的利好,亞馬遜雲科技也準備好與客戶一起探索並提供堅實的算力支持和豐富的合作資源。
此外,智慧硬體企業也在積極擁抱大模型。四川諦達諾科技有限公司是一家將人工智慧、大數據分析等技術套用於幼稚園「管、教、保」場景的高新技術企業,其自主研發的兒童健康智慧機器人目前已落地全國65個城市,服務超過2000家幼稚園。「積極擁抱變化,今年計劃讓機器人接入大模型。」諦達諾科技科技CEO許波表示,將接入一些比較細分的大模型,推出更聰明的智慧機器人,緊緊抓住教育和康養這「一小一老」場景,開發具象機器人/數位虛擬人等智慧硬體+大模型產品。