當前位置: 華文世界 > 科技

Sora再度顛覆AI影片行業,A股哪些公司有相關布局?

2024-02-19科技
人工智能(AI)巨頭OpenAI又出王炸,其最新推出的文生影片大模型Sora因其「逼真」和「富有想象力」被廣泛贊譽,其生成影片可達60秒也顛覆了傳統影片生成領域平均只有4秒的影片生成長度。
OpenAI官網介紹,Sora是一種擴散模型,它從看起來像靜態雜訊的影片開始生成影片,然後透過多個步驟消除雜訊來逐漸對其進行轉換生成影片。Sora能夠一次生成整個影片或擴充套件生成的影片以使其更長。透過一次為模型提供多個幀的預見,OpenAI解決了一個具有挑戰性的問題,即確保主題即使暫時離開視野也保持不變。
與GPT模型類似,Sora使用Transformer架構。Sora建立在過去對DALL·E和GPT模型的研究之上。 它使用DALL·E 3的重述技術,該技術涉及為視覺訓練數據生成高度描述性的標題。因此,該模型能夠更精準遵循生成使用者的文本指令。
OpenAI表示,Sora是能夠理解和模擬現實世界的模型基礎,相信這一功能將成為實作AGI(通用人工智能)的重要裏程碑。
券商建議關註多模態技術
Sora影片一出,立刻震驚業界。360集團創始人、董事長周鴻祎2月16日在微博發文表示,這意味著AGI實作將從10年縮短到1年。
其實,Sora出現之前,也有其他類似的AI影片模型。比如,谷歌在去年12月21日釋出一個全新的影片生成模型VideoPoet,能夠執行包括文本到影片、影像到影片、影片風格化等操作。Meta則有名為Emu的模型。此前一夜爆紅的文生影片軟件Pika更掀起了AI影片套用熱潮。
浙商證券認為,短期內,Sora及同類產品可大幅提升影像和短影片的制作效率,改變創意生產及行銷工作流,提升短影片產品生產力,對於業態更加復雜的長影片和遊戲,受限於模型目前還無法很好理解因果關系,和其他技術難點,現階段或以提供美術靈感支持為主。中長期來看,Sora及同類產品將參與到改變資訊生產和分發兩大環節的行程中,PGC(專業生產內容)將廣泛采用AI工具輔助生產,UGC(使用者生產內容)將借助AI工具逐步替代PGC。此間,AI生成影片工具的商業化將提速,目前Sora還未公布收費標準,參照之前Runway等文生影片工具收費情況,定價相對較高。鑒於Sora采用的世界模擬器技術路徑,邊際成本或有降低的可能。
浙商證券列出的下遊套用側,從相關受益細分行業來看,包括但不限於影片美化、廣告行銷、短劇、遊戲、辦公軟件等。具體到投資標的,建議關註美圖公司(1357:HK)(視覺大模型+大DAU影像套用)、中文線上(300364)(短劇出海+IP)、閱文集團(0772:HK)(IP)、金山軟件(3888:HK)、三人行(605168)等;上遊增加需求來看,推薦關註輝達等演算法、算力方面標的。
東方證券早前的報告認為,從技術突破的角度來看,下一階段的重點攻克方向必然會是多模態技術。能夠真正處理和套用好多模態AI能力,才能真正打通物理世界和數碼世界的障壁,用最基礎的感知世界能力直接生成操作,實作與物理世界最自然的互動。因此,基於多模態的套用場景仍需不斷探索,AI影片生成僅僅是多模態技術路徑中的一個小方向,多模態領域的ChatGPT時刻還未到來。
東方證券建議關註海康威視(002415)、大華股份(002236)、螢石網絡(688475)、中科創達(300496)、虹軟科技(688088)、科大訊飛(002230)、萬興科技(300624)等公司。
中泰證券研報指出,跨時代文生影片模型,有望推動硬件需求進一步提升。Sora基於圖片做長影片生成,再基於生成影片做extend,其所需token(文本處理最小單位)數量相較於文本及圖片模型的推理,有望成數量級增長,判斷Sora將刺激推理算力需求將持續上升。此外,推理端token增加、算力需求的增長,也對視訊記憶體及頻寬提出更高要求,預計將拉升400G光通訊技術在乙太網路中的套用,並有望推動800G乃至1.6T光通訊技術的套用。
哪些A股公司有布局?
據不完全統計,已有十多家A股上市公司之前已經布局多模態大模型或對AI影片相關研發。
海康威視(002415)在去年4月20日回復投資者提問時披露,公司從幾年前就開始研發視覺大模型,現在已經到了多模態大模型的研發階段,包括視覺、語音、文本等多模態訊號的融合訓練及處理。
大華股份(002236)於2023年10月釋出「星漢大模型」,該模型融合點雲、語音、影像等輸入,構建了多模態融合的行業視覺大模型。
大華股份在1月15日在投資者問答中介紹,公司多模態融合的行業視覺大模型(大華星漢大模型),是基於公司過去豐富的行業和細分場景的業務經驗,面向以視覺為核心的智慧物聯領域,透過融合影像、點雲、文本、語音等多模態數據所搭建的,大幅提升了視覺解析能力,該模型為解析式大模型,與市面上的ChatGPT等生成式大模型有明顯差異。
萬興科技(300624)此前釋出音影片多媒體大模型萬興「天幕」。據了解,萬興「天幕」是一個以音影片生成式AI技術為基礎的多媒體創作垂類大模型,由影片大模型、音訊大模型、圖片大模型、語言大模型組成,聚焦數碼創意垂類創作場景。
2月2日,萬興科技在互動平台表示,天幕大模型主要基於公司在數碼創意領域二十年的產品開發與營運經驗而打造的音影片多媒體大模型,具備多媒體、垂直解決方案、算力數據及套用本土化等特色,以更智能、更沈浸的功能效果和產品體驗賦能全球內容創作者的創意表達。
博匯科技(688004)1月9日在回復投資者提問時表示,公司透過運用人工智能、大數據等技術,對采集到的數據進行分析、特征學習和樣本訓練,構建智慧監管模型,提升了對文本、圖片、音訊、影片等多模態數據的處理分析能力,進一步強化核心技術優勢,提高產品競爭力。
易點天下(301171)在2月4日在投資者互動平台表示,公司旗下AIGC創作平台KreadoAI可以幫助企業實作從指令碼撰寫、語音複制、個人化數碼人選擇到輸出口播影片的內容生產AI化全鏈路閉環。
數碼視訊(300079)1月4日互動平合表示,公司多年來積極自主研發積累AI技術,龍其是在影片內容生產領域,持續不斷探素AIGC生成式技術,並配合智能稽核技術、多模態智能搜尋等實作全媒體行業的媒資管理,構建全新視音訊服務。
漢王科技(002362)2023年12月31日互動平台表示,公司在文本、影像、影片、生物特征、語音等多欖態辨識、文本理解和利用等技術上耕耘多年,並形成智能終端產品和行業解決方案。目前正在研發的AI模型尚屬於新生技術,在文本生成、生成內容的控制與稽核等方面的技術細節尚在進一步完善。
當虹科技(688039)1月5日互動平台表示,公司擁有自研的AIGC工具集,釋出了以靜態照片生成三維體積影片的方案,並且透過點雲模型轉換及壓縮演算法實作高達800倍的視覺無損壓縮,實作不同模態之間相互切換。公司AIGC影片內容智能生成系統融合了大模型技術,能助力使用者在新聞傳播、影片內容創作等多項領域中創作出優質影片內容。
東方國信(300166)去年12月27日互動平台表示,在AI多模態方面,公司在文本、語音、影像、影片等非結構化數據類別的AI分析上,均有套用產品和落地案例。視覺類有基於Stable Diffusion的影像生成能力,其他視覺類大模型套用還在探索技術路徑和套用場景。
神思電子(300479)2023年12月26日在互動平台表示,公司經過多年人工智能領域積累,已突破了遠距離全天候復雜場景激光熱成像聯動入侵檢測技術,掌握了基於深度學習的非結構化數據處理、影片分析、語音對話、知識管理以及雲平台技術。公司正在對於文生圖、圖生文、影片生文、文生影片等多模態數據互相跳轉的收斂性質進行研究,支撐培訓、檢索、推薦、目標追蹤等多個場景的生成式大模型套用。
因賽集團(300781)2023年12月25日在互動平台表示,公司InsightGPT具備文生文、影片智能剪輯、圖生影片等功能,目前正在開發文生影片功能。在現有圖生影片等技術框架下,InsightGPT目前可生成20秒以上的影片。在目前文生影片的邏輯流程中,InsighGPT先結合影像、影片大模型,融合摳圖等多種演算法,再結合音訊模型,整體渲染後最終合成完整影片。
拓爾思(300229)2023年12月14日在互動平台表示,公司在Transformer架構方面積極跟蹤業內最新技術,未來將根據技術研發和業務需求的實際情況,適時采用類似架構。
國脈文化(600640)去年12月12日在互動平台表示,公司在文生影片方面,已內部開發基於大模型的AIGC數碼內容生成平台,平台利用多模態技術,使用自有的版權內容,生成文字、音訊、圖片、影片等影視素材,進行內容的創作生產,正在內部試用中。
佳都科技(600728)在2023年12月11日在互動平台表示,公司TransCorc-M多模態大模型能夠理解立本、影像、影片等多種模態的資訊,並且按照使用者需求將其進行描述、提示或轉化為指令程式碼,是個非常「聰明」的交通資訊小助手。
(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)