當前位置: 華文世界 > 科技

萬興科技AIGC成色幾何:60秒文生影片公測,開月薪10萬招AI人才

2024-05-08科技

本文來源:時代財經 作者:謝斯臨

圖源:天幕文生樣板影片截圖

Sora爆火兩月之後,國內迅速有A股上市公司做出跟進,推出同樣具備文生影片能力的多媒體大模型。

4月28日,A股數碼創意軟件龍頭萬興科技(300624.SZ)旗下天幕大模型開啟公測。據萬興科技此前介紹,該模型是國內首個音影片多媒體大模型,目前已叠代文生音樂、多語言對話、一鍵成片等近百項音影片原子能力。特別是在文生影片能力上,已實作不同風格、豐富場景及主題的連貫性,一鍵生成時長支持60秒左右。

這一影片生成時長,甚至可以比肩全球頂級大模型企業OpenAI在今年2月釋出文生影片模型「Sora」。該產品最長可生成60秒左右的影片,因其生成影片的一致性、清晰度,和模擬真實物理世界的能力震驚世界。

在公測的同時,萬興科技也公布了2023年業績,營收與利潤均實作明顯增長。財報數據顯示,公司2023年實作營業收入14.81億元,同比增長25.49%,歸母凈利潤8620.57萬元,同比增長113.20%。

自4月18日宣布將公測天幕大模型之後,其影片生成能力如何尚未可知,但萬興科技的股價和市值卻已「聞風而動」。時代財經統計發現,截至4月30日收盤,萬興科技報92元/股,總市值達126.69億元。相比18日收盤的113.07億元,其市值上漲超過13億元,漲幅達12%。

自2018年上市後,萬興科技的股價幾經大起大落,作為曾坐擁"獨角獸""元宇宙"等多個概念股標簽,萬興科技的天幕大模型是否真的如宣傳般強大?

萬興科技副總裁朱偉曾公開表示,天幕的模型能力和Sora相比確實還存在一定差距。尤其是文生影片效果方面,他曾在接受媒體采訪時表示,「Sora作為行業標桿,是公司正在努力看齊的目標。」

就研發投入、商業化前景等問題,時代財經向萬興科技發去采訪提綱。

朱偉在接受時代財經采訪時指出,為打造天幕大模型,公司在研發層面配備了上百人的研發團隊,每年需投入數千萬元,此外還有數據采買的投入和算力的投入,三者總計上億級別的投入。

此外,朱偉表示,天幕有自己差異化的特點,相較於Sora這類基礎模型,天幕更偏向於細分的垂類行業,希望聚焦到每一個具體的套用場景,解決實際問題,為使用者帶來價值。如AI歌手、數碼人播報等能力,就是在具體細分場景中的落地體現,屬於純套用。「我們希望萬興科技的每一款產品,都是技術與套用的結合,能解決某個細分領域的具體問題。」

據時代財經不完全統計,目前已入局AI大模型的國內互聯網頭部公司中,尚無一家宣傳能夠生成10秒以上的文生影片,更多的還是圖生影片。如騰訊混元曾聯合清華、港科大推出圖生影片大模型「Follow Your Click」;阿裏智能計算研究所也推出過EMO,也僅支持用照片和音訊生成唱歌影片。

那麽,作為國內第一批宣稱擁有60秒AI影片生成的公司,萬興科技到底成色幾何?

開月薪10萬招AI人才

天幕開放公測後,時代財經第一時間做出試用申請,排在等候序列的1458位元,截至發稿申請仍未透過稽核。

官網資訊顯示,天幕主要具備文字生成影片、已有影片風格化處理、文字生成背景音樂、影片配樂、文字生成音效、文字生成圖片,以及圖片生成圖片等7項能力。以市場最受關註的文生影片為例,天幕支持最長2000字的描述詞,並提供寫實和動漫兩種風格進行選擇。

圖源:萬興科技官網截圖

4月18日,萬興科技官方公眾號放出的59秒樣板影片,畫面比起Sora放出的AI生成影片,影片在一致性和連貫性的表現尚有一定差距。

事實上,時長是文生影片模型套用落地的關鍵環節。互聯網大廠AI研究員艾長青指出,即便生成影片效果好,但如果沒能從底層演算法結構上支持影片時長的可延伸性,模型很難找到合適的落地場景,只能停留在實驗室環節。

「業界影片生成模型核心關註的點包括影片的生成時長是否是可延伸,以及生成質素是否達標。前者是被認為是根本性、方向性的問題,後者則是數據質素打磨、訓練方式的問題。」艾長青表示。

在天幕公測的前一天,4月27日,生數科技首席科學家、清華大學教授朱軍在中關村論壇未來人工智能先鋒論壇上,釋出了影片大模型Vidu。該模型采用團隊原創的Diffusion與Transformer融合的架構U-ViT,支持一鍵生成長達16秒、分辨率高達1080P的高畫質影片內容。Vidu不僅能夠模擬真實物理世界,還擁有豐富想象力,具備多鏡頭生成、時空一致性高等特點。

生數科技的投資人啟明創投發文評價道:「Vidu是自Sora釋出之後全球率先取得重大突破的影片大模型,效能全面對標國際頂尖水平,並在加速叠代提升中。」

德邦證券研報亦指出,在以鏡頭語言為代表的動態性,以及對物理世界規律的理解與模擬能力等方面已做到了Sora相近水平,Vidu或將發揮在國產影片大模型的「鮎魚效應」,激勵國產多模態大模型突破創新。

也有聲音認為,國產影片生成模型仍處於初級階段,早期效果不佳可以理解。艾長青向時代財經指出,影片是三維以上的空間,相比於文本模型,訓練難度數量級增加,必須依靠大量算力作為支撐。當前,國內沒有足夠的算力,較難開展影片生成模型的研究。

「國內影片生成模型距離套用程度還有很長的路要走,至少還需要兩年甚至更長時間,才會有通用效果比較好的模型出現。」艾長青因此認為,國內陸續有影片生成模型問世其實是件好事,只有邁出第一步,才能夠相互交流不斷叠代提升能力。

時代財經還發現,萬興科技近期在以極高的待遇吸引AI領域的高端人才。據萬興科技此前釋出的2024年度春招資訊,AIGC相關產品經理和研發崗位的基礎起薪超過40萬,其中圖形影像演算法工程師等關鍵崗位月薪最高可達10萬元,年薪超過百萬元;多模態音影片演算法工程師、基礎平台架構師等崗位月薪亦超過5萬元。

圖源:萬興科技官網

天使投資人、資深人工智能專家郭濤則向時代財經指出,對於文生影片模型這一新興領域,不同公司產品可能處在不同發展階段,「即便萬興科技的天幕大模型表現不如Sora,但這並不代表他們的技術研發沒有價值,最終還是要看與實際業務、市場套用的結合情況。」

AIGC間接帶動業績增長

通用大模型的競爭是少數平台級巨頭公司的遊戲,對於絕大多數企業來說,更關鍵的是如何將已有的能力投入可以快速變現的商業場景——天幕大模型究竟能給萬興科技帶來多少業務增量?

作為一家以向C端客戶銷售創意類數碼軟件的上市公司,萬興科技從2023年開始,就已經嘗試將AIGC能力套用在產品之中,不僅旗下萬興喵影、萬興PDF、億圖圖示、億圖腦圖、萬興易修等多款產品上線了適配的AIGC功能,如AI摳圖、AI降噪、AI文案、AI圖片生成等,還釋出了數碼人短影片行銷工具萬興播爆、AI虛擬陪伴套用TruMate、AI文字影片剪輯工具Kwicut等創新型的AIGC產品。

但這些探索沒有直接轉化成為收入。朱偉向時代財經透露,公司大多數原有產品暫未強制推行AI收費等商業化策略,因此並未帶來直接的收入增長。

影響更多是間接的。朱偉以萬興喵影舉例表示,該產品自去年10月底上線文本成片、AI音樂生成等功能後,一定程度帶動內容服務需求和使用者黏性的提升,年內實作素材資源訂閱金額提升100%,進一步最佳化產品的營收質素和效率。

萬興科技在2023年年報中表示,AIGC能力的引入,疊加產品叠代升級的影響,幫助公司文件創意類產品線付費使用者數提升20%,營收達1.3億元,同比增長30.92%;繪圖創意類產品月活同比增長30%,營收達1.29億元,同比增長30.52%;影片創意類產品訂閱續費率提升5%個點,營收達9.6億元,同比增長28.91%。2024年一季度,萬興科技營業收入3.58億元,同比增長0.9%;歸母凈利潤2564.98萬元,同比增長22.99%。

目前還未得到大規模落地套用的影片生成能力,成為萬興科技下一步增長的關鍵。

「在文本大模型領域,免費可能是大家的共識,因為成本相對可控,而且使用者越多越有利於大模型快速升級。但對於訓練成本、推理成本巨大的影片大模型來說,必須考慮更多。」朱偉指出,從原則上來講,萬興科技會更慎重地向免費使用者提供影片AIGC能力。同時,重點將這一能力推向付費意願和能力相對更強的B端使用者,盡快把音影片多媒體大模型真正推向商用。

據萬興科技年報,其前五大客戶占其年度銷售總額比例為66.96%。

去年曾收兩次關註函

去年大模型爆火帶動AI概念股股價起飛之時,萬興科技就曾多次在互動平台釋放與ChatGPT相關利好,如表示公司已有商用賬號開通GPT-4的API介面;已與微軟簽訂了雲服務框架協定,且海外主要產品已接入Azure OpenAI服務等。

萬興科技也成了當年漲幅最大的幾只牛股之一。雪球數據顯示,2023年,萬興科技股價從年初的每股30.65元,一路瘋漲,到同年6月20日的頂峰時刻,曾一度觸及每股172.2元的歷史記錄,漲幅超過4倍。而後股價開始回落,截至2023年底仍報每股94.6元,漲幅超過208%。

圖源:Pixabay

2023年3月27日和5月8日,萬興科技兩次收到深交所的關註函,詢問公司相關產品運用ChatGPT、AIGC等技術的具體情況,有無帶來直接收入,以及是否存在蹭熱點、炒概念及配合股東減持的情形。

萬興科技對此回復表示,公司采用AIGC相關技術旨在實作功能升級和智能化效率提升,增強產品吸重力。但未針對AI新技術、新功能進行單獨收費,因此沒有帶來直接收入;也暫未收到實控人、董監高的減持計劃,因此不存在蹭熱點、炒概念及配合股東減持的情形,後續有相關事項,公司將嚴格按照規定做出披露。

然而就在2023年5月回復完深交所不到半個月之後,萬興科技便釋出公告表示,公司實控人吳太兵計劃在未來6個月時間內,減持不超過206萬股,即不超過公司總股本的1.5%。同年7月26日,這一減持計劃宣告結束,以減持均價初略計算,吳太兵套現超過2億元。

去年,在吳太兵減持萬興科技前後,還有大量AI牛股上演花樣減持,如創始人前妻減持並將50%收益借給上市公司的昆侖萬維(300418.SZ),以及被質疑離婚式減持的三六零(601360.SH)等。

在中國數實融合50人論壇智庫專家洪勇看來,判斷一家公司行為是否涉嫌蹭概念炒作,需從實際研發投入、產品功能、市場套用等多個角度綜合考慮。

「如果企業只是在宣傳上誇大其詞,而沒有實質性技術創新或明顯產品優勢,可能確實存在概念炒作的嫌疑。但如果其持續在技術研發上有所投入,並且產品能夠逐步提升並滿足特定市場需求,即便當前表現不如國際先進水平,也應視為行業發展的正常過程。」洪勇對時代財經表示。