當前位置: 華文世界 > 科技

2024Q1人工智能「裏程碑」盤點:Sora和Kimi做對了什麽?

2024-03-31科技

財聯社3月31日訊(編輯 唐葉天) 2024年一季度即將結束。在以ChatGPT為起點的AI風潮席卷世界一年後,全球生成式AI套用加速發展,多模態模型及套用成為新一輪AI競賽的「主戰場」。目前,國內AIGC賽道套用層品類持續多元化,海外助手類套用逐漸成為主流。

盤點一季度資本市場最「出圈」的AI套用,文生影片賽道上,Sora在2月春節假期後引起市場關註;3月國產AI對話助手Kimi在突破200萬字的長文本技術後,存取量與市場關註度激增;3月下旬,初創企業Suno釋出同名模型V3版本釋出,一條龍「包辦」歌詞、歌聲、配樂,指向多模態套用流行新趨勢。

文字聊天助手在ChatGPT問世之後成為各方人工智能巨頭進軍的方向,而多模態AI套用在2023年也已開始批次湧現, 2024年仍然在A股「出圈」的Sora、Kimi做對了什麽?

Sora:更長的影片與商業化落地

繼文生影片「獨角獸」Pika大火之後,龍年春節期間,OpenAI釋出的文生影片大模型Sora迅速風靡。Sora初步具備了理解物理世界的能力,率先將文生影片長度突破了1分鐘長度,較其他模型表現更出色,還支持圖生影片、影片生影片、影片擴充套件、多角度鏡頭等。春節後,Sora行情引領A股人工智能概念走強。

其最關鍵的突破可以概括為以下幾點,據中泰證券概括, 一是生成效果上的可用性極高(60s時長、分辨率1080p);二是從技術路線上解決了模態之間的對齊問題;三是從產業發展看,Sora通用性極強,有望統一影片生成生態。

而另一邊,Pika等競爭者也在持續叠代,3月,Pika添加了 AI 影片自動生成音效功能,使用者可以直接在應用程式中完成並建立新的聲音檔,在此之前,Pika還推出了口型同步功能,在成為「一條龍」式AI 影片平台的路上前進。

Kimi:開啟超長文本競爭

Kimi智能助手這一AI對話工具由月之暗面(Moonshot AI)在2023年10月推出,之後歷經三次版本叠代。三月中旬,月之暗面宣布在大模型長上下文視窗技術上取得新的突破,Kimi智能助手已支持200萬字超長無失真上下文。

隨後,「解鎖」長文本能力的Kimi概念在市場爆火,多家上市公司釋出公告稱接入Kimi或正在與其溝通。百度、阿裏也雙雙宣布加碼,角逐長文本大模型賽道。

目前海內外商業化AI套用仍然以聊天助手類為主。在海外,a16z最新的全球 AI 產品 Top100 榜單2024年有22家新公司上榜,LLM助手占主導地位,ChatGPT網站穩居榜首。在國內,根據AI產品榜aicpb.com統計,目前國內智能聊天助手占主流,國內存取量前十中有六款產品為AI ChatBots,其中目前Kimi增速最高,2月環比為107.6%,在國內AI產品存取量排行榜中的排名升至第3位,僅次於百度文心一言的1006萬和阿裏通義千問的365萬。

Kimi在競爭激烈的同類產品中被二級市場關註,民生證券認為, 優勢在於其長文本處理能力,領先於同期其他模型產品 。月之暗面創始人曾表示: 「無失真的長上下文是通用人工智能的關鍵基礎」 。而這一趨勢在海外同類產品中也已出現。機器之心數據顯示,OpenAI尚未上線的GPT-4.5Turbo上下文視窗將高達256K token(約20萬詞),Anthropic剛剛釋出的Claude 3支持200K tokens上下文。

Suno: 降低AI音樂創作門檻

近期,AI初創公司Suno更新了文生音樂模型Suno V3,可透過幾秒時間創作2分鐘的「廣播級」音質完整歌曲,並新增了更豐富的音樂風格和流派選項,如古典音樂、爵士、Hiphop等。相比V1版本20-40 秒的時長,V3版本在完整度、提示詞依從以及互動界面等各方面都有改進。Suno V3支持AI生成音樂歌詞,但其能力側重於音訊生產,在文本生成方面,其與Open AI有合作。在模型執行時,Suno呼叫ChatGPT生成歌詞和標題。

AI套用在向多模態延伸的同時,智能文字助手的接入也在成為AI初創企業的新嘗試。

掀起行情的「爆款」AI有何共通之處?

無論是Sora的強擴充套件性長影片,還是Kimi的超長無失真上下文、Suno在文生音訊中呼叫ChatGPT實作「一條龍」創作,都填補了市場中AI產品的某些技術性空白。而其更多的共通點在於面向C端使用者的開放體驗和顯著的商業化預期。

ToC的切入點

Sora尚未正式釋出,但其母公司OpenAI是最早一批開啟人工智能商業化的企業。在Sora的測試階段,其最先被開放給視覺藝術家、設計師、電影制作人等群體,首批拿到Sora授權的導演、藝術家們已在本周公開自己創作的最新短片。Kimi與Suno均有面向C端使用者的免費存取形式,也獲得良好口碑。華泰證券觀點表示,Kimi的戰略是基於閉源的C端模型,加速模型叠代,讓B端公司接入其API合作賦能。

商業化預期

獲A股市場關註的AI模型/套用單品往往有著更清晰的商業化預期。

在文生影片賽道,最新訊息顯示,OpenAI試圖借助Sora進軍好萊塢。據報道,OpenAI計劃下周在美國洛杉磯與好萊塢諸多工作室、媒體高管、藝人經紀開會,以構建娛樂產業的合作夥伴關系、並鼓勵眾多制片公司將OpenAI的新款AI影片生成器融入它們的工作中。OpenAI CEO Altman已經在今年奧斯卡電影節周末出席洛杉磯的多場活動。

在智能聊天助手賽道,Kimi母公司聯合創始人預計,2024年會推出多模態模型及產品,預計在24年上半年開啟商業化模式。而這一發展路徑,在海外已被OpenAI驗證過。

熱門AI套用對A股市場的影響?

Sora與LLM推理更需要記憶體頻寬的資源需求不同,視覺模型推理將對芯片本身算力和記憶體容量提出更高要求。縱觀機構對Sora概念所給出的投資建議,機會集中於: ①光通訊領域和算力基礎設施領域,需要更高的算力和頻寬②AI文生影片技術有望對影視、廣告行銷、遊戲與視覺內容創作等傳媒領域進行重塑。

和Kimi相關的投資主線則包括 語料素材庫價值的凸顯(包括文字、影像、影片)、Kimi賦能套用的邏輯、與其他國產優質大模型合作的邏輯 。Kimi近期連續宕機則顯示從訓練走向推理對於算力的需求將會巨大,而且這種需求僅僅剛開始。華福證券復盤稱,回顧本年Kimi行情,最先領漲的是可接入Kimi的套用場景,包括閱讀、短劇劇本生成等場景相關的標的,而後行情傳導到模型語料,即擁有影片語料、文字語料的各個標的,子版塊輪動路徑和OpenAI行情較為相似。

與Suno相關的投資機會,開源證券解讀稱, AI音樂生成模型訓練或拉動對音樂版權、音訊語料數據的需求

除了以上「爆款」AI,近期還有階躍星辰大模型(萬億參數)、輝達的一系列AI套用新部署等面世,AGI範式的構建仍在不斷重塑中。在此過程中,機構的投資建議更多地指向訓練數據集、算力和套用賦能。

算力、數據集、套用方向的新機會

國產AI算力鏈在芯片、交換機、儲存、AI伺服器等方向的機遇早已明確,而2024年新生的機遇也在醞釀。一季度,國盛證券表示, 國內外對液冷的需求有望形成共振 ,液冷從「可選」到「必選」的過程將大幅提升市場空間,成為算力重要細分賽道;興業證券有色金屬研究團隊認為,輝達新釋出的GB200 NVLink銅互聯方案以及高速連結器需求放量有望開啟 高端銅合金市場需求

2024年人工智能產業對於訓練數據集的需求持續多模態化,開源證券表示, 長文本訓練或拉動知識、文學類語料需求,多模態訓練或拉動圖片、影片類語料需求 。AI領域版權糾紛不斷,海外近期多起由於未經出版社同意使用版權方內容訓練大模型判罰落地,驗證數據要素價值。三月末,國內【生成式人工智能服務安全基本要求】落地,方正證券表示,優質的影片和文本版權商價值凸顯。

AI對套用的賦能在ToB領域也已有許多嘗試,近期的機構觀點更多指向多模態、長文本的套用加速 。華泰證券表示,綜合當下全球AI套用發展情況,海外ToC套用進展與國內大模型能力升級或將成為2024年AI套用的關註重點。海外,AI套用2023年針對ToB場景全面鋪開,大模型逐步嵌入企業IT基礎架構。伴隨模型能力提升,ToC套用有望迎來新拐點,多模態套用與智能終端(AI手機、AIPC)有望提速;國內,大模型能力最佳化仍是產業重點,長文本能力成為當前多家公司的模型能力重點。伴隨基礎模型能力提升,國內AI套用產品化、商業化節奏有望全面加快。

下一個Kimi何處尋?

從技術角度上,中泰證券認為,繼文本、程式碼、圖片、影片之後,下一個有可能實作突破的AI模態大概率是3D 。目前海外在AI+3D技術上主要分為工業場景探索與非工業場景探索。非工業場景套用探索主要主要面向遊戲、元宇宙中的3D資產設計;工業場景套用則主要以衍生式設計軟件。但AI+3D建模技術當前也面臨較多挑戰,如3D數據與資產缺乏、AI訓練難度高、AI即時渲染技術有限、商業化落地難度大等問題。

而從A股市場角度,能夠掀起行情的「黑馬」往往出現在ToC端受眾群體較多且有商業套用催化的方向 。天風證券電腦團隊在Kimi掀起市場熱潮期間曾經釋出相關問卷調查,結果顯示,Kimi 培育使用者習慣逐步形成且黏性很高,並非行銷導流的一次性熱潮,同時在某些特定場景下也形成了使用者的核心需求(如金融)。 從繞不開的通用場景如辦公出發,垂直場景看好金融,建議關註辦公軟件、多模態賽道、金融和法律套用、B 端套用等