當前位置: 華文世界 > 科技

零一萬物李開復:用最少的芯片、最低的成本去訓練「能力所及」的模型

2024-05-13科技

經濟觀察網 記者 錢玉娟 5月13日,創新工場董事長兼CEO李開復帶隊孵化的AI公司零一萬物,正式釋出了千億參數規模的閉源模型Yi-Large。這是零一萬物釋出的第一個閉源模型,也是第一個千億參數規模模型。

這次Yi-Large釋出,許久未露面的李開復還透過個人抖音帳號對釋出全程進行了直播。他介紹,在史丹佛評測機構AlpacaEval 2.0官方認證的最新模型排行榜上,Yi-Large模型的英語能力主要指標LC Win Rate(控制回復的長度)排到了世界第二,僅次於美國人工智慧研究公司OpenAI旗下最新大模型ChatGPT-4 Turbo。

在各家大模型進入能力力求對標ChatGPT-4的階段,零一萬物在Yi-Large模型能力評測和展示環節,也表示在通用能力、程式碼生成、數學推理、指令遵循等多方面,模型指標超越了ChatGPT-4、Google Gemini 1.5等同級模型。

除了釋出閉源模型Yi-Large,李開復還宣布零一萬物早先釋出的Yi-34B、Yi-9B等中小尺寸開源模型,版本可升級到Yi-1.5系列。借此機會,零一萬物公開了開源、閉源雙軌大模型的戰略布局。

2023年零一萬物創立,以開源模式進入AI領域。2023年11月,零一萬物先發Yi系列開源模型,僅一個月後,Yi-34B版本模型成為國內唯一一個被輝達AI Playground(AI遊樂場,一個提供預訓練模型和資源的平台)收錄的大模型。

Yi系列開源模型釋出後,零一萬物收到了來自全球開發者的反饋,「從學習、導航、銷售、API(應用程式編程介面)的套用到商業寫作,都已經開始有早期使用者」。李開復認為模型開源會讓全球每個使用者受益,他甚至覺得,學生、創業者、老師、科研人員、公益組織都需要用大模型,但「無論用ChatGPT-4還是Yi-Large,(他們)都會嫌太大、太貴」。

與OpenAI這一超級獨角獸在巨額融資後可以用超級多的GPU展開模型訓練不同,「我們是務實的AGI(通用人工智慧)信仰者」,李開復說,零一萬物走出了一條適合自己的路,就是用最少的芯片、最低的成本去訓練「能力所及」的模型。

談及零一萬物的發展方向,李開復稱,「我們的精力不會放在行業預測,也不會用大力出奇跡的唯一思維,(去)追求能不能用一百億美金、一千億美金(預測AGI的燃點)」,他認為與零一萬物相關度更高的是「AI普惠點」,他希望團隊成為一個「點燃者」,幫助開發者透過API和Yi系列模型,在電商、社交、娛樂等領域打造出AI時代的淘寶、微信、抖音等。

「現在是分秒必爭。」李開復看到國際大廠都在不斷叠代進步,零一萬物的步伐也在加快,在推出Yi-Large大模型的同時,零一萬物內部已經啟動了下一代模型Yi-XLarge的相關訓練。

李開復稱,目前「不是可以做一個模型,然後就休兵半年、一年的時間」,團隊正朝著美國前沿大模型去探索模型技術的進步。李開復也見證著中國公司在一個新的環境裏快速並野蠻生長,「當然會有一家又一家(公司)慢慢地轉型甚至退場」,但他隨後說,眼下中國模型市場還在成長中,不要低估中國創業者的生命力。