李開復：新模型效能超GPT-4o 高效能白菜價才能做好PMF

2024-10-17科技

【億邦原創】大模型獨角獸放棄預訓練？

國內外模型層差距拉大？

大模型套用難盈利？

……

2024年大模型領域一直縈繞著關於技術、套用、商業化的陰雲，亟待每個參與者給出解答。

2024年10月16日上午，零一萬物CEO李開復博士釋出了最新旗艦模型Yi-Lightening，也帶來他對大模型發展的最新研判。

這款旗艦模型在國際權威盲測榜單LMSYS上取得亮眼成績，超越OpenAI的GPT-4o-2024-05-13和Anthropic Claude 3.5 Sonnet，排名世界第六。同時零一萬物也賣出白菜價： 0.99元/100萬Token 。「將高效能模型給出白菜價，才有望幫客戶跑通PMF。」李開復表示。盡管價格喜人，但零一萬物依舊有利潤，「我們不做虧本生意。」

除了模型層的快速叠代，零一萬物在商業化方面也顯得老道。李開復相信在大模型時代所有套用都值得重做一邊，但從哪個角度切入？零一萬物的選擇是， 在國內做to B，在海外做to C。 「國內流量越來越貴，而國外的C端產品，獲客成本和變現能力能算得過帳。在國內，優先尋找B端罕見的、少數的、能夠收費的場景，不做專案客製。」

看過國內SaaS的崛起又黯然、AI1.0時代的先揚後抑，李開復對大模型的顛覆性抱有極高期待，同時又落子謹慎。

1、放棄預訓練？不可能的

隨著模型層的門檻從萬卡集群向著十萬卡集群演進，更大的算力支出，更低的模型價格，更高的技術門檻，大模型的競爭盡管還沒來得及取得太多商業化成績，已經開始進入淘汰賽。

李開復聽到不少傳言，中國6個大模型獨角獸（智譜AI、MiniMax、百川智能、零一萬物、階躍星辰、月之暗面）中，有兩家已經放棄了預訓練。

這次他在公開場合正面反駁這一說法。 首先，零一萬物不會放棄預訓練；其次，各個獨角獸企業的融資額完全支撐得起各自的預訓練。 「零一萬物一次預訓練的production run是300多萬美金，這筆費用大家都付得起，我覺得中國6家大模型公司，只要有夠好的人才，有想做預訓練的決心，融資額跟GPU都不會是問題的。」

換言之，預訓練模型大逃殺？不存在的。

同時零一萬物推出了自己的新款旗艦模型Yi-Lightening，距上次旗艦模型Yi-Large的釋出僅過去5個月。

Yi-Lightening再次沖上國際權威榜單。在國際權威盲測榜單LMSYS上，Yi-Lightning超越OpenAI的GPT-4o-2024-05-13和Anthropic Claude 3.5 Sonnet，排名世界第六，國內第一。「零一萬物緊隨OpenAI、Google之後，與xAI打平，進擊全球前三大模型企業。」李開復宣布。

模型能力表現在效能上，就是推理速度的提升和推理成本的降低。Yi-Lightning首包時間（從接收到任務請求到系統開始輸出響應結果之間的時間）較Yi-Large提升一倍，目前已上線Yi大模型開放平台，每百萬token僅需0.99元，直逼行業最低價。

這一成果的達成有賴於零一萬物成熟的訓練方法論，比如，與稠密模型架構不同的MoE架構、獨特的混合註意力機制（Hybrid Attention）、動態Top-P路由、多階段訓練（Multi-stage Training）等。

「我們有更成熟的訓練方法， 只花了xAI成本的1%或2%，做出來的Pre-training模型跟Grok-2-08-13打平 。」李開復解釋。

2、部署成本更低，有客戶GMV增幅達170%

優秀的大模型需要搭配精細的商業閉環，才能取得應有效果。

比如，對於一個連鎖餐飲店老板來說，如何線上上有效行銷，吸引周圍顧客來店裏瞧一瞧看一看？有老板覺得，投放KOL成本高，用人直播價格貴。而零一萬物的數碼人解決方案顯得優質高效容易上手——只需要請人來錄5分鐘影片，就可以收集該主播的形象、聲音、大腦。此後店鋪只要輸入打折內容，選擇人聲和語調，就可以開始全天候直播。

這個數碼人可以進行即時對話，自主生成直播話術，也能夠快速、精準地辨識直播彈幕的互動意圖，給出對應解答。而且數碼人不會亂講話，只在有商家和有授權形象的情況之下才會做直播。

這是零一萬物推出AI2.0數碼人解決方案，其中包含角色大模型、直播聲音大模型、電商話術大模型等一整套專用模型基座。其中，角色大模型提供了動作訓練、表情生成等能力，直播聲音大模型使得數碼人邁過了多國語言和情感表達的門檻，電商話術大模型則成為了數碼人主播的「AI大腦」，負責連結知識庫，完成智能對話。

Yi-Lightning模型接入後，數碼人會對彈幕意圖的辨識更加精準、生成話術更自然、能夠一步到位完成促單。隨著與客戶合作行程的不斷深入，基於模型本身強大的函數呼叫能力，零一萬物AI 2.0數碼人還能夠絲滑地與客戶原有行銷、物流系統互動，實作從引流到下單的全流程陪護。

除直播外，零一萬物也為數碼人客戶準備了 AI 2.0門店短影片解決方案。 客戶可透過極簡流程，隨時生成、超低成本和高品質行銷影片影片，解決了傳統真人短影片的成本和制作周期問題。

短影片與直播內容相互配合，為商品提供持續曝光，提升轉化率。

目前，零一萬物的AI 2.0數碼人解決方案涵蓋了AI伴侶、IP形象、電商直播、辦公會議等多個套用場景，合作案例包括全國某著名餐飲連鎖、某頭部酒旅類客戶、全國某知名水果連鎖店等，均取得了顯著的GMV提升。其中某頭部酒旅企業在接入Yi-Lightning全新加持的數碼人直播後，GMV較此前上升170%。

3、「模型＋AI基礎設施＋套用」缺一不可

2024年中國大模型行業進入「長跑階段」，技術側和產業側都從燥熱變得冷靜，也在進一步思考行業的前行方向。

對於近期炸場的OpenAI o1，李開復認為o1帶來的最大改變是認知，「o1的思考模式是把預訓練裏做的工作放到了推理側。如果說在一年半前，大家覺得大模型最厲害的地方是預訓練，一年以後發現post-training同樣重要。感謝OpenAI點醒了這一點，我相信中美很多公司都在往o1的方向去狂奔。」

據他了解，OpenAI把o1拿出來一個理由是需要融資，而GPT-5訓練不順利。

對於在算力受限的情況下，中國基座模型的研發能力處在世界什麽身位，如何追趕國外頂尖大模型等問題引，李開復給出一個具體數碼：GPT-4o在5月13號釋出，Yi-Lightening在10月把它打敗，零一萬物和美國頂尖模型之間的差距是5個月。

「縮短模型層的差距非常困難，谷歌、xAI等企業都是用10萬張GPU進行訓練，零一萬物透過2000張GPU，訓練出不遜於xAIGrok的模型，因為團隊有成熟的訓練方法論，同時也在快速分析新技術內核，將與OpenAI、谷歌SOTA模型的差距保持在6個月內。」

最後李開復指出，在大模型的競爭中，零一萬物會堅持「模型＋AI基礎設施＋套用」三位一體的全棧式布局，以國際SOTA的基座模型為基礎，積極在ToB企業級解決方案上探索TC-PMF，助力中國打造以大模型為引擎的新質生產力。

億邦持續追蹤報道該情報，如想了解更多與本文相關資訊，請掃碼關註作者微信。