當前位置: 華文世界 > 科技

62歲李開復,又有了新身份

2024-05-15科技

作者丨趙曉曉

編輯丨關雎

圖源丨零一萬物

5 月 13 日,上午 10:00,李開復準時出現在鼎好大廈的A座20層,一身藏藍色西服套裝,淺色襯衫配領帶,三七分的發型,跟去年 3 月份的一場分享會上穿著幾乎一致,唯一區別是臉上多了一副眼鏡。

這是零一萬物成立一年後,李開復首次在媒體面前公開露面,他回答了關於新品和零一萬物的一切,並首次對去年涉及Llama架構的爭議做出回應。

零一萬物去年7月上線,11月釋出了第一個模型Yi-34B,半年後的今天又釋出了新的千億參數閉源模型 Yi-Large 和第一個國內to C產品 「萬知 AI」,李開復還親自出任萬知的CEO。

在史丹佛的開源評測計畫 AlpacaEval 2.0 上,Yi-Large 英語能力主要指標 LC Win Rate(控制回復的長度) 排位世界第二,僅比 OpenAI 今年 4 月釋出的新版 GPT-4 Turbo略輸一點,勝率(Win Rate)則排到了第一。在中文能力上,SuperCLUE 更新的四月基準表現中,Yi-Large 位列國產大模型之首。

史丹佛AlpacaEval 2.0 Verified認證模型類別,英語能力評測:零一萬物的Yi-Large Preview 的 LC Win Rate為51.9%,排第二,Win Rate為57.5%,排第一。

去年零一萬物陸續上線的 4 個海外產品中,有一個生產力產品的 ROI (投資報酬率)已經實作了 1,這就表示增長還可以更激進。海外產品的收入主要來自C端使用者付費,「今年會有1-2億元收入、近千萬使用者。」 李開復說。

這是一場既要速度又要技術的較量。今天的AI環境與上一次四小龍時代完全不同,它能帶來真實的價值,大模型的臨界點是AI普惠點,誰先點燃這個點,它會成為一個行業裏的巨頭。

有人把李開復稱為「最年長的」 中國大模型創業者,他今年已經 62 歲,零一萬物也成為中國六家大模型獨角獸之一。40 年前,李開復在博士論文申請信裏寫到,「AGI就是我的夢想。」

「我這次創業,十年都不會套現。」李開復說。

做AGI 時代的微軟

去年 3 月的分享會上,李開復把AI 2.0定義為「絕對不能錯過的一次革命。」它的巨大躍遷之處是克服了AI 1.0單領域、多模型、沒有實作商業化的限制,能帶來真實的價值。

「比如生產力的 AI 套用,過去從來沒有一刻可以做到別人幫我寫報告、寫文章和做 PPT,也從來沒有一個軟體,可以幫我分析總結一千頁、甚至一萬頁的文字。」李開復說。

2022 年底,ChatGPT出現後對市場進行了最快速度的教育。GPT4釋出後,成為大模型領域的「一個金標準」,同時還點燃了 to B 跟 to C 的機會。

一家公司如果抓住了一次技術浪潮,它會成為一個行業裏的巨頭,如果兩次技術浪潮都能抓住,它就會成為一個世界性的卓越公司。

「所以我們要自己下場做。」李開復說。

李開復1983 年開始在卡耐基梅隆大學攻讀電腦博士,對人工智慧領域已經有近 40 年的研究。過去十幾年,他一直是創業者背後的支持者,這次走向台前,是因為他相信這是人類有史以來最重要的技術,不能錯過這次革命。

零一萬物的起點是海外,to B。

去年 9 月,零一萬物在海外上線了4 款產品,其中有一個生產力產品的 ROI(投資報酬率)已經實作了 1。這意味著,零一萬物從使用者手中收到的訂閱費,已經低於獲取使用者成本加 GPU 的成本,擺脫了「燒錢獲客。」

李開復和團隊有一個標準,一般至少要看到ROI達到 0.6 才會開始推,否則使用者越多越虧錢。如果產品推到了 1,就表示增長還可以更激進。4款海外產品裏,娛樂、陪伴類的ROI 還在較低的階段,生產力產品已經給零一萬物帶來了一個億的收入,有近千萬的使用者。

去年11 月釋出的開源模型Yi-34B,在權威榜單中超越了Meta AI研發並開源的 Llama2-70B、阿聯的技術創新研究所開發的Falcon-180B等大幾倍的模型,成為當時世界範圍內開源最強基礎模型之一。

釋出會開始的前夕,零一萬物的團隊連夜在 Hugging Face、魔搭社群等海外社群上線了六個 API ——Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark ,「一早起來就看到Reddit上的討論非常火熱。」

目前,零一萬物的海外產品模型選型是Yi-Large 加 GPT-4 的組合,「最開始推出的時候我們的自研模型還沒有做好,Yi-Large在海外上線後,會成為我們即時對比測試自研模型的平台。」零一萬物生產力產品負責人曹大鵬說。

「現在我們完全有底氣把已經達到PMF(Product Market Fit,產品與市場互相匹配)的產品,再推回中國。」李開復說。

海外的AI生態已經非常繁榮,很多AI原生套用已經誕生,甚至達到了數千萬美金的收入,也有很多的成熟產品和公司用OpenAI的 API做出了自己的第二曲線新業務。相比之下,國內會慢一點,還在探索階段。

零一萬物暫時不做國內的to B業務,不接計畫制的訂單,是因為李開復覺得國內還沒有逃離上次 AI 1.0 的魔咒——一些很優秀創業公司,陷入了一個高成長但低品質的惡性迴圈裏。

to C相對好做一些,萬知是零一萬物的第一款C端產品,精準切入了「找、讀、寫」 職場人的三大需求,也是業內第一款具有「AI-First」理念、將模型能力與套用場景完美融合的to C套用產品。

「所有的套用都應該是AI-First、AI-Native,沒有AI就不成立。」李開復說,「比如PPT 制作功能,在國內外就很少看到。」Google前CEO艾瑞克·史密斯對此給予的肯定是,「資訊包裝是500億美金的市場」。

零一萬物會做很多事,海外、國內,to B、to C,它Day One 就是一個全球化的是公司。公司已經啟動下一代 Yi-XLarge MoE 模型訓練,沖擊 GPT-5 的效能與創新性。

「我們的理念就是要做AGI 時代的微軟。」李開復說。

每個公司都要找到自己的TC-PMF

任何時候,創業者都要學會在相對充分的資源裏,尋求成本和效率的最優解。

李開復定義了一個新的詞匯:TC-PMF——在尋找產品與市場匹配點的基礎上,加上了技術(technology)和成本(cost),這是一個四維的匹配。

強調技術和成本,是因為李開復認為,PMF已經不能完整地定義大模型的創業了,因為要考慮到模型現在的技術能力、之後的發展情況和推測成本。

「現在的AI 和行動網際網路有一個很大差別,就是行動網際網路沒有推理成本。」李開復說。

比如某些套用需要 AI 不能有幻覺,那麽現在的技術就有挑戰;有些套用需要大尺寸的模型或者長文本視窗,但這可能帶來 50 秒的推理延遲,如果處理一百萬token ,就要花 75 塊錢。

在行動網際網路時代,PMF曾是眾多初創企業追求的核心目標,使用者規模增長所帶來的邊際成本很低。但在大模型時代,模型訓練和推理成本都很貴,是每一個創業公司都會面臨的增長陷阱,很多公司會因此胡亂燒錢,走向破產。

「所以每個公司都要找到自己的 TC-PMF。」李開復說。他把TC-PMF即將在一個套用領域出現的那個點叫AI普惠點,只有達到這個點,技術、模型和成本之間才能達到最完美的匹配狀態。而在這個點來臨之前,企業要先把產品做出來,等待時機,成為一個Popular App。

抖音成為Super app的時間點有兩個,第一個點是4G的普及,第二個點是安卓千元機的普及,兩個點的先後到來,一下子把短視訊市場擴大了100倍。

最快找到的方式是自己做推理引擎,這需要很強的模型團隊、AI Infra(基礎層)團隊和套用團隊,三個團隊成為一體,互相配合。這是一件聽起來簡單,但做起來很難的事情,也是企業自建推理引擎遇到的最大挑戰。

零一萬物團隊是國內極少數能吸引到谷歌、微軟在內的高水平演算法人才的公司,除了團隊之間配合默契外,他們尤其重視 AI Infra的最佳化工作:從選擇伺服器到設計機房和部署 GPU,再到建向量資料庫,都是自己來,自己掌握降低推理成本的節奏。

「好處是,別人的推理成本降低十倍時,我們可能降二十、三十倍。」李開復說。多方面最佳化GPU 成本後,其訓練千億參數的 Yi-Larege 模型時,同比下降了一倍左右;接入自研向量資料庫後,成本比用第三方向量資料庫下降至18%。海外 TC-PMF 已經進入ROI為正的階段。

必須自己找 TC-PMF,還因為李開復相信,「沒有一種技術可以吃一輩子,一定要找到技術之外的壁壘。」

他舉例,行動網際網路時代,為什麽安卓、蘋果、微信這麽強,抖音還能殺出來?

就是因為字節跳動很早就預測到了用 AI 來推薦短視訊,找到了自己的PMF,把握住時間視窗,打造了非常高的使用者黏性和成長率。當它成為一個有海量使用者的普惠套用,微信就再也沒辦法復制抖音、把它殺死了。

大模型推理成本的下降會推動中國AI大模型進入「落地為王」的階段,李開復判斷,今年會迎來「大模型套用爆發元年」,明年下半年,將迎來大模型普惠套用的井噴期。

「做AGI 是我的夢想」

李開復現在有四個身份:創新工場創始人、投資人、零一萬物創始人、萬知CEO(Chief Experience Officer首席體驗官)。

2009 年,李開復在北京中關村成立了創新工場,開辟了中國風險投資和創業的新模式,至今他已經做了 15年的投資人。在AI 1.0時代,創新工場投了第四正規化等10多家AI獨角獸企業。

去年李開復 61 歲,他選擇成為一名創業者,這個年紀已經是大多數人的退休年紀,只因為他看到了人類有史以來最重要的技術,才決定「再努力一把。」

這也是李開復40多年前寫進博士申請信裏的夢想,希望未來有機會能在AGI領域做一些事。過去幾十年,他一直在研究AI可能會對人類產生的影響,並先後出版了三本相關書籍,多數人對他「儒雅」的印象也都源於他「作家」的身份。他還建議年輕人多了解AI,別只關註「AI會不會取代我們的工作。」

成為萬知CEO是因為他沒給自己設其他選項,「從一開始我就考慮自己做CEO,」李開復說,對於首款to C產品,他覺得前期還需要傾註更多心血去發現問題並及時修善。從萬知上線到現在,他每天都會測上一百條以上的問題。

最有價值的修改建議是搜尋框的加長,這是他在谷歌時遇到的問題,使用者在搜尋框輸入兩三個字搜不出來東西,輸入十個字結果就變好了,最後解決方案是做了一個更長的搜尋框。

據零一萬物 API 平台負責人藍雨川透露,零一萬物今年在C端收入會在1-2 億元,微軟的Office每年有幾十億美金的收入。「生產力產品市場的天花板非常高,我們也在思考如何把人工智慧工作空間做得更大。」藍雨川說,作為結果,零一萬物可以擴充套件海外市場,比如去中東、東南亞。

過去一年,李開復成為非常有熱度的人物,一多半是因為零一萬物在短時間內上線,又在短時間內推出了多款新品,並在天使輪就成為獨角獸。另一小半是因為陷入Llama架構的爭議。

「套殼的說法純屬子虛烏有,當時有很多技術專家寫過詳細文章解釋了。」李開復說,中國大模型的架構都是基於Transformer或 Llama 的架構,技術圈對 Llama 架構這個稱呼本來就不同意。

「對於大模型來說,權重更高的是訓練本身以及透過訓練獲得的參數和程式碼。零一萬物 Yi 模型是從零開始訓練,自己獲得的參數和程式碼,沒有參考任何 Llama 或其他模型的參數。」 李開復說。

今天的AI已經是個充分競爭的市場,比拼的不止是技術、團隊,還有心態。對於AI,李開復是有點偏執在的,他專註於把產品做好,其他的事情交給市場去驗證。

他最近還開了抖音號,但不是為了直播帶貨,是為了分享好的技術和產品。站在投資人身份的角度,李開復說如果他手裏有很多錢,會全部投給零一萬物。

這次創業,李開復的期望是「沖一下萬億美元」,AGI是一個很大很大的夢想,不能只是為了賺點錢。

他也承諾投資人,十年不會套現。