當前位置: 華文世界 > 科技

李開復:新模型效能超GPT-4o 高效能白菜價才能做好PMF

2024-10-17科技

【億邦原創】大模型獨角獸放棄預訓練?

國內外模型層差距拉大?

大模型套用難盈利?

……

2024年大模型領域一直縈繞著關於技術、套用、商業化的陰雲,亟待每個參與者給出解答。

2024年10月16日上午,零一萬物CEO李開復博士釋出了最新旗艦模型Yi-Lightening,也帶來他對大模型發展的最新研判。

這款旗艦模型在國際權威盲測榜單LMSYS上取得亮眼成績,超越OpenAI的GPT-4o-2024-05-13和Anthropic Claude 3.5 Sonnet,排名世界第六。同時零一萬物也賣出白菜價: 0.99元/100萬Token 。「將高效能模型給出白菜價,才有望幫客戶跑通PMF。」李開復表示。盡管價格喜人,但零一萬物依舊有利潤,「我們不做虧本生意。」

除了模型層的快速叠代,零一萬物在商業化方面也顯得老道。李開復相信在大模型時代所有套用都值得重做一邊,但從哪個角度切入?零一萬物的選擇是, 在國內做to B,在海外做to C。 「國內流量越來越貴,而國外的C端產品,獲客成本和變現能力能算得過帳。在國內,優先尋找B端罕見的、少數的、能夠收費的場景,不做專案客製。」

看過國內SaaS的崛起又黯然、AI1.0時代的先揚後抑,李開復對大模型的顛覆性抱有極高期待,同時又落子謹慎。

1、放棄預訓練?不可能的

隨著模型層的門檻從萬卡集群向著十萬卡集群演進,更大的算力支出,更低的模型價格,更高的技術門檻,大模型的競爭盡管還沒來得及取得太多商業化成績,已經開始進入淘汰賽。

李開復聽到不少傳言,中國6個大模型獨角獸(智譜AI、MiniMax、百川智能、零一萬物、階躍星辰、月之暗面)中,有兩家已經放棄了預訓練。

這次他在公開場合正面反駁這一說法。 首先,零一萬物不會放棄預訓練;其次,各個獨角獸企業的融資額完全支撐得起各自的預訓練。 「零一萬物一次預訓練的production run是300多萬美金,這筆費用大家都付得起,我覺得中國6家大模型公司,只要有夠好的人才,有想做預訓練的決心,融資額跟GPU都不會是問題的。」

換言之,預訓練模型大逃殺?不存在的。

同時零一萬物推出了自己的新款旗艦模型Yi-Lightening,距上次旗艦模型Yi-Large的釋出僅過去5個月。

Yi-Lightening再次沖上國際權威榜單。在國際權威盲測榜單LMSYS上,Yi-Lightning超越OpenAI的GPT-4o-2024-05-13和Anthropic Claude 3.5 Sonnet,排名世界第六,國內第一。「零一萬物緊隨OpenAI、Google之後,與xAI打平,進擊全球前三大模型企業。」李開復宣布。

模型能力表現在效能上,就是推理速度的提升和推理成本的降低。Yi-Lightning首包時間(從接收到任務請求到系統開始輸出響應結果之間的時間)較Yi-Large提升一倍,目前已上線Yi大模型開放平台,每百萬token僅需0.99元,直逼行業最低價。

這一成果的達成有賴於零一萬物成熟的訓練方法論,比如,與稠密模型架構不同的MoE架構、獨特的混合註意力機制(Hybrid Attention)、動態Top-P路由、 多階段訓練(Multi-stage Training)等。

「我們有更成熟的訓練方法, 只花了xAI成本的1%或2%,做出來的Pre-training模型跟Grok-2-08-13打平 。」李開復解釋。

2、部署成本更低,有客戶GMV增幅達170%

優秀的大模型需要搭配精細的商業閉環,才能取得應有效果。

比如,對於一個連鎖餐飲店老板來說,如何線上上有效行銷,吸引周圍顧客來店裏瞧一瞧看一看?有老板覺得,投放KOL成本高,用人直播價格貴。而零一萬物的數碼人解決方案顯得優質高效容易上手——只需要請人來錄5分鐘影片,就可以收集該主播的形象、聲音、大腦。此後店鋪只要輸入打折內容,選擇人聲和語調,就可以開始全天候直播。

這個數碼人可以進行即時對話,自主生成直播話術,也能夠快速、精準地辨識直播彈幕的互動意圖,給出對應解答。而且數碼人不會亂講話,只在有商家和有授權形象的情況之下才會做直播。

這是零一萬物推出AI2.0數碼人解決方案,其中包含角色大模型、直播聲音大模型、電商話術大模型等一整套專用模型基座。其中, 角色大模型提供了動作訓練、表情生成等能力,直播聲音大模型使得數碼人邁過了多國語言和情感表達的門檻,電商話術大模型則成為了數碼人主播的「AI大腦」,負責連結知識庫,完成智能對話。

Yi-Lightning模型接入後, 數碼人會對彈幕意圖的辨識更加精準、生成話術更自然、能夠一步到位完成促單。隨著與客戶合作行程的不斷深入,基於模型本身強大的函數呼叫能力,零一萬物AI 2.0數碼人還能夠絲滑地與客戶原有行銷、物流系統互動,實作從引流到下單的全流程陪護。

除直播外,零一萬物也為數碼人客戶準備了 AI 2.0門店短影片解決方案。 客戶可透過極簡流程,隨時生成、超低成本和高品質行銷影片影片,解決了傳統真人短影片的成本和制作周期問題。

短影片與直播內容相互配合,為商品提供持續曝光,提升轉化率。

目前,零一萬物的AI 2.0數碼人解決方案涵蓋了AI伴侶、IP形象、電商直播、辦公會議等多個套用場景,合作案例包括全國某著名餐飲連鎖、某頭部酒旅類客戶、全國某知名水果連鎖店等,均取得了顯著的GMV提升。其中某頭部酒旅企業在接入Yi-Lightning全新加持的數碼人直播後,GMV較此前上升170%。

3、「模型+AI基礎設施+套用」缺一不可

2024年中國大模型行業進入「長跑階段」,技術側和產業側都從燥熱變得冷靜,也在進一步思考行業的前行方向。

對於近期炸場的OpenAI o1,李開復認為o1帶來的最大改變是認知,「o1的思考模式是把預訓練裏做的工作放到了推理側。如果說在一年半前,大家覺得大模型最厲害的地方是預訓練,一年以後發現post-training同樣重要。感謝OpenAI點醒了這一點,我相信中美很多公司都在往o1的方向去狂奔。」

據他了解,OpenAI把o1拿出來一個理由是需要融資,而GPT-5訓練不順利。

對於在算力受限的情況下,中國基座模型的研發能力處在世界什麽身位,如何追趕國外頂尖大模型等問題引,李開復給出一個具體數碼:GPT-4o在5月13號釋出,Yi-Lightening在10月把它打敗,零一萬物和美國頂尖模型之間的差距是5個月。

「縮短模型層的差距非常困難,谷歌、xAI等企業都是用10萬張GPU進行訓練,零一萬物透過2000張GPU,訓練出不遜於xAIGrok的模型,因為團隊有成熟的訓練方法論,同時也在快速分析新技術內核,將與OpenAI、谷歌SOTA模型的差距保持在6個月內。」

最後李開復指出,在大模型的競爭中,零一萬物會堅持「模型+AI基礎設施+套用」三位一體的全棧式布局,以國際SOTA的基座模型為基礎,積極在ToB企業級解決方案上探索TC-PMF,助力中國打造以大模型為引擎的新質生產力。

億邦持續追蹤報道該情報,如想了解更多與本文相關資訊,請掃碼關註作者微信。