當前位置: 華文世界 > 科技

李開復:絕不放棄預訓練,中美頂尖模型只差5個月

2024-10-17科技

10月16日,繼上半年釋出千億參數模型 Yi-Large 之後,李開復帶領的大模型公司零一萬物對外釋出最新旗艦模型 Yi-Lightning,並對於坊間關於中國多家大模型企業已放棄預訓練的傳言進行了回應,「零一萬物絕不放棄預訓練」,他說。

在最新的國際權威盲測榜單LMSYS(由加州柏克萊分校等國際知名高校合作創立)上,Yi-Lightning剛剛超越了今年5月釋出的GPT-4o版本及Claude 3.5 Sonnet,排名世界第六,中國第一。這也是在 LMSYS 這一全球大模型必爭的公開擂台上,中國大模型首度實作超越 OpenAI GPT-4o的成績。

「如果真的計算中國趕超美國有多遠的距離,至少零一萬物只差五個月。」李開復說。不過他也提到,要進一步縮短時間差非常困難。

「頭部公司資金、算力不是問題」

最近,在自媒體平台上,關於國內大模型創業公司AI「六小虎」(智譜、零一萬物、MiniMax、百川智能、月之暗面、階躍星辰)有一些負面傳言——稱某幾家已經放棄預訓練模型,而是將業務重心轉向AI套用,並稱零一萬物就是其中一家。

所謂預訓練,指的是在特定任務上進行微調之前,對大語言模型進行的初始訓練階段。有業內人士比喻道,預訓練就好比大模型的基礎教育階段,賦予模型海量而通用的知識,是決定模型效能最關鍵的階段,也是模型廠商最核心的技術壁壘。

在Yi-Lightning釋出之際,李開復再次對「中國大模型行業將逐步放棄預訓練」這一業界推測作出回應。他表示,做預訓練通用大模型是一個系統性技術活,需要眾多懂芯片、模型、推理、架構、演算法的人才,做這件事的成本也非常高,不是每家公司都可以做成。「以後可能會有越來越少的大模型公司做預訓練。」他判斷稱。

不過李開復也表示,據他所知,作為行業頭部公司,「六小虎」均有足夠的融資額度,都付得起預訓練模型Production Run(投產執行)三四百萬美金一次的訓練成本,只要有足夠好的人才和做預訓練的決心,資金和算力資源不會是問題。

世界頂級模型要能做到「白菜價」

在攻堅大模型公司核心技術壁壘的同時,大模型行業的商業化落地無疑已成為多家大模型創業公司發展中的裉節點。

在過去,模型效能與推理成本之間的投入產出比一直是企業們在選擇大模型時必然要考慮的因素。據了解,此次上線的Yi-Lightning的 API 定價至行業極低水平——每百萬 token 僅需0.99元。李開復稱,「要有世界頂級的模型做到白菜價」,才可能實作通用人工智能普惠落地。

「我們真實的成本比每百萬token0.99元更低,並不是虧錢拉使用者。我們不會賠錢賣模型,但也不會賺很多錢,而是在成本線上加一點點小小的利潤。」在回應是否燒錢打價格戰問題時,他說,大模型只有實作高效能、白菜價,才能真正啟用健康的生態環境。

釋出會上,李開復還首次對媒體公布了零一萬物企業級AI 2.0 數碼人產品和落地進展。基於以Yi Lightning 模型為代表的 Yi 模型,其搭建起了包含角色大模型、直播聲音大模型、電商話術大模型在內的一整套專用模型基座,其解決方案涵蓋了AI伴侶、IP形象、電商直播、辦公會議等多個套用場景,合作案例包括餐飲連鎖、酒旅類頭部企業等。

其中,角色大模型為AI 2.0 數碼人提供了動作訓練、表情生成等能力,直播聲音大模型使得數碼人邁過了多國語言和情感表達的門檻,電商話術大模型則成了數碼人主播的「AI 大腦」,負責連結知識庫,完成智能對話。例如,當某頭部酒旅企業在接入Yi-Lightning 加持的數碼人直播後,數碼人幾乎能夠以假亂真,對觀眾的彈幕問答能給出精準、有人情味的回應,其直播商品交易總額較此前上升170%。

大模型長跑「技術+套用」都不能落下

隨著中國大模型行業從狂奔進入到「長跑」階段,如何讓大模型技術走出實驗室,走入實業助力新一波經濟增長,成為各方關註點。

李開復透露,截至目前,零一萬物ToB(企業級)解決方案已在零售、醫療、教育、物流等領域內完成落地,涉及 AI 搜尋、AI 生產力工具、AI 智能巡檢等套用場景。自今年6月開始,零一萬物相繼宣布與阿裏雲、360、順豐科技、飛書、釘釘、鈦動科技等頭部企業達成合作,已積累起了一批包含世界 500 強企業在內的付費企業客戶。

「我們會堅持‘模型+AI 基礎設施+套用’三位一體的全棧式布局,以國際SOTA (State of the art,意為「最先進的」)的基座模型為基礎,積極在企業級解決方案上探索TC-PMF(技術成本產品與市場契合度),助力中國打造以大模型為引擎的新質生產力。」李開復說。

來源:北京日報客戶端

記者:孫奇茹