零一萬物李開復：用最少的芯片、最低的成本去訓練「能力所及」的模型

2024-05-13科技

經濟觀察網記者錢玉娟 5月13日，創新工場董事長兼CEO李開復帶隊孵化的AI公司零一萬物，正式釋出了千億參數規模的閉源模型Yi-Large。這是零一萬物釋出的第一個閉源模型，也是第一個千億參數規模模型。

這次Yi-Large釋出，許久未露面的李開復還透過個人抖音帳號對釋出全程進行了直播。他介紹，在史丹佛評測機構AlpacaEval 2.0官方認證的最新模型排行榜上，Yi-Large模型的英語能力主要指標LC Win Rate（控制回復的長度）排到了世界第二，僅次於美國人工智慧研究公司OpenAI旗下最新大模型ChatGPT-4 Turbo。

在各家大模型進入能力力求對標ChatGPT-4的階段，零一萬物在Yi-Large模型能力評測和展示環節，也表示在通用能力、程式碼生成、數學推理、指令遵循等多方面，模型指標超越了ChatGPT-4、Google Gemini 1.5等同級模型。

除了釋出閉源模型Yi-Large，李開復還宣布零一萬物早先釋出的Yi-34B、Yi-9B等中小尺寸開源模型，版本可升級到Yi-1.5系列。借此機會，零一萬物公開了開源、閉源雙軌大模型的戰略布局。

2023年零一萬物創立，以開源模式進入AI領域。2023年11月，零一萬物先發Yi系列開源模型，僅一個月後，Yi-34B版本模型成為國內唯一一個被輝達AI Playground（AI遊樂場，一個提供預訓練模型和資源的平台）收錄的大模型。

Yi系列開源模型釋出後，零一萬物收到了來自全球開發者的反饋，「從學習、導航、銷售、API（應用程式編程介面）的套用到商業寫作，都已經開始有早期使用者」。李開復認為模型開源會讓全球每個使用者受益，他甚至覺得，學生、創業者、老師、科研人員、公益組織都需要用大模型，但「無論用ChatGPT-4還是Yi-Large，（他們）都會嫌太大、太貴」。

與OpenAI這一超級獨角獸在巨額融資後可以用超級多的GPU展開模型訓練不同，「我們是務實的AGI（通用人工智慧）信仰者」，李開復說，零一萬物走出了一條適合自己的路，就是用最少的芯片、最低的成本去訓練「能力所及」的模型。

談及零一萬物的發展方向，李開復稱，「我們的精力不會放在行業預測，也不會用大力出奇跡的唯一思維，（去）追求能不能用一百億美金、一千億美金（預測AGI的燃點）」，他認為與零一萬物相關度更高的是「AI普惠點」，他希望團隊成為一個「點燃者」，幫助開發者透過API和Yi系列模型，在電商、社交、娛樂等領域打造出AI時代的淘寶、微信、抖音等。

「現在是分秒必爭。」李開復看到國際大廠都在不斷叠代進步，零一萬物的步伐也在加快，在推出Yi-Large大模型的同時，零一萬物內部已經啟動了下一代模型Yi-XLarge的相關訓練。

李開復稱，目前「不是可以做一個模型，然後就休兵半年、一年的時間」，團隊正朝著美國前沿大模型去探索模型技術的進步。李開復也見證著中國公司在一個新的環境裏快速並野蠻生長，「當然會有一家又一家（公司）慢慢地轉型甚至退場」，但他隨後說，眼下中國模型市場還在成長中，不要低估中國創業者的生命力。