當前位置: 華文世界 > 科技

to B要掙錢、to C要謹慎,李開復的大模型堅持

2024-10-17科技

10月15日深夜,零一萬物的Yi-Lighting大模型在LMSYS盲測競技場的投票數超過1萬次,拿到了這個國際權威測試榜單的入場券,「出來的結果是,我們排在全球第六」,10月16日上午,零一萬物CEO李開復向媒體宣布時一字一頓。為了強調,他還補充,「我們和馬斯克(特斯拉CEO)的xAI Grok打平,並列第六,按公司算零一萬物排在全球第四名。」

當天,他還向媒體公布並演示了to B戰略下的行業套用產品AI 2.0數碼人,這一產品聚焦零售和電商等場景。「to B就做國內,做有利潤的解決方案」,李開復目標明確,面對國內C(使用者)端市場,零一萬物則會非常謹慎,「先不推出中國本土新的to C的套用」。

預訓練成本只是對手的1%或2%

「任何一個新的模型要有1萬次投票才會進入這個榜單,昨天(10月15日)晚上,Yi-Lightning模型在LMSYS上終於達到了1萬次以上的投票」,李開復邀請媒體體驗LMSYS這個大模型擂台。

作為一個公益專案,LMSYS被認為是「大模型最強盲測」,援引這一榜單的科技大佬不止Open AI的CEO山姆·柯曼和谷歌首席科學家傑夫·迪恩。

根據李開復公布的總榜單,零一萬物的Yi-Lightning排在Open AI、Google和xAI的大模型之後,全球排名第六。具體到分榜,在中文分榜,Yi-Lightning與o1-mini 等模型並列排名世界第二;在多輪對話分榜,排名第三;數學、代碼分榜上,Yi-Lightning分獲第三、第四名;艱難提問、長提問榜,Yi-Lightning都取得第四名。

據了解,Yi-Lightning是零一萬物開發的Yi系列大語言模型,支持上下文16K,是零一萬物最新高效能模型。根據內部評測數據,在8xp00 算力基礎下,以同樣的任務規模進行測試,Yi-Lightning 的首包(從接收到任務請求到系統開始輸出響應結果之間的時間)時間是Yi-Large的一半,最高生成速度提升近四成。

李開復介紹時,則向媒體重復強調了成本。

「我們知道xAI在訓練Grok時是幾萬張的GPU(圖形處理器),現在囤了10萬張GPU。我們這次預訓練只用2000張GPU訓練一個半月,花了300多萬美元,做出來的預訓練模型跟Grok打平,卻只花了它1%或2%的成本」,李開復表示滿意。

他也再次重申,「零一萬物絕不放棄預訓練。做好預訓練是一個技術活,要非常多有才華的人在一起慢工出細活。如果一個公司有幸擁有懂芯片的、懂推理的、懂基礎架構的、懂模型的,有很多的做演算法的人才能跨領域合作,我相信中國絕對可以做出世界排名前十的預訓練通用模型」。

把時間差保持在6個月就很好

「但做這件事的成本比較高,以後可能做預訓練的大模型公司會越來越少,」李開復話鋒一轉,「據我所知,大模型‘六小虎’(包括零一萬物、百川智能等六家獨立大模型初創公司)的融資額都是夠的,我們做一次300萬美元,這個錢頭部公司也付得起。」

還是圍繞著榜單做對比。GPT-4o是Open AI在5月14日推出的大模型,在最新的LMSYS總榜中,排在Yi-Lightning之後。「我們在10月把GPT-4o打敗了,所以零一萬物和美國頂尖模型的時間差只有5個月」,李開復說。

時間差是個老話題,從2023年初國內大模型紮堆上線,被一個又一個大佬回答過。這個問題重要與否見仁見智。不論得到的時間是多少,都證明了一點——差距依然存在。

「縮短時間差非常困難,畢竟人家10萬張GPU,我們2000張。能達到這個效果是因為團隊優秀,再加上研發有特色,用這套方法把時間差保持在6個月左右,已經是很好的結果了。如果要破局,可能需要一個前所未有的演算法才有機會」,李開復同時告訴媒體,「千萬不要認為落後6個月是很羞恥的事情,如果用類似零一萬物的打法,我認為可能不止我們一家能把時間差控制在6個月,但難度不低。」

0.99元/100萬Tokens,不參與價格戰

另一個層面的控制體現在價格上。目前,Yi-Lightning已在Yi大模型開放平台上線,0.99元/100萬Tokens。

一般來說,國內大模型企業普遍用1000Tokens定價。以科技大廠阿裏雲為例,官網列舉的通義千問系列大模型qwen-turbo相對較低,行銷活動後的輸入價格是0.0003元/1000Tokens、輸出價格0.0006元/1000Tokens,即分別是0.3元/100萬Tokens、0.6元/100萬Tokens。

「這個定價確實具有顯著優勢,在競爭激烈的AI市場中,價格優勢往往能成為吸引使用者的關鍵因素」,北京市社會科學院副研究員王鵬向北京商報記者表示。

在和媒體溝通時,李開復三次提到這個價格,他承認這是白菜價,但也直言「零一萬物還是有利潤空間的,不參與價格戰」。

除了效能、價格,零一萬物對市場也有自己的堅持。

當天零一萬物推出to B新產品AI 2.0解決方案,把Yi Lightning 實踐於具體行業解決方案。基於以Yi Lightning模型為代表的Yi模型,零一萬物搭建起了包含角色大模型、直播聲音大模型、電商話術大模型在內的一整套專用模型基座。

在回答to B、to C選擇的問題時,李開復告訴媒體,「一個大模型公司同時做to B、to C是很辛苦的,需要多元化的管理方式。選擇在國內做to B,是因為我們找到了一些破局的空間,比如用數碼人來做零售、餐飲等,能做一個完整的解決方案。我覺得這樣的to B只能在中國做,to B就做有利潤的解決方案,而不只是賣模型,不只是做專案制」。

對於to C,零一萬物的主要布局在海外。在他看來,流量成本是大模型to C的很大問題,「在這樣的挑戰環境裏我們會非常謹慎,我們先不推出中國本土新的to C的套用,已有的產品還會繼續維護」。

零一萬物的思路適合整個大模型行業嗎?「C端使用者沒有很強的付費需求和意願。想依靠他們來實作盈利,短期來看是不切實際的,」瑞達恒研究院經理王清霖告訴北京商報記者,「B端市場為了提高效率、跟上時代步伐、吸引投資人的註意力,可能有一些是相對剛需的購買意願。如真的能夠切入某一類或者某一個領域,了解他們的需求,是有可能搶占市場先機的。」

北京商報記者 魏蔚