零一萬物CEO李開復博士
鈦媒體App獲悉,5月13日上午,創新工場董事長兼CEO、零一萬物CEO李開復博士在北京釋出全新零一萬物千億參數Yi-Large閉源模型,以及包括開源模型等產品矩陣,並披露今年公司To C單一產品收入達1億元人民幣。
李開復表示,隨著一年前ChatGPT風靡全球,以Yi-Large為核心的中國大模型從此前「追趕」到如今效能超越GPT-4大模型,中美大模型差距越來越小。
「一年前,中國大模型感覺太落後(於美國)了。但今天我們非常自豪的說,我們(零一萬物)狂奔了一年,在模型方面至少趕上了美國最頂尖、一年前釋出的(大模型)產品,當然以後還要繼續努力。但我們對未來會需要有一個沈澱和展望,不能只是拼命狂奔。」李開復表示。
當被問及楊植麟套現話題,李開復回應稱,盡管不點評公司情況,但 他創立零一萬物的時候向投資人承諾,10年不「套現」, 而且他認為最好的套現方式是「趕快上市」,這是其未來兩年努力的目標。
針對中國如何追趕美國大廠不斷叠代新模型, 李開復回應鈦媒體App稱,零一萬物的新模型已訓練一半,之後會朝著美國大模型繼續進步。「我們不能保證一定趕上它(美國模型)、超過它,或者gap有多少,但是我們用適合我們的方法快速推進,既然我們不能用10萬張GPU來訓練,我們就會尋找別的方式,依然能做出非常好的效果。」
據悉,零一萬物(01.AI)成立於2023年5月16日,致力於打造全新的 AI 2.0 平台與AI-first生產力套用的全球化公司,由創新工場董事長兼CEO李開復創立,並擔任零一萬物CEO。
2023年11月,零一萬物釋出首款研發的開源 AI 大模型系列「Yi」,包括60億、340億參數的Yi-6B、34B兩個版本,效能超越;今年3月,零一萬物公布基於全導航圖的新型向量數據庫,名為笛卡爾(Descartes)。
今年5月,零一萬物推出首款免費一站式 AI 工作平台「萬知」,不僅可以速讀60萬字【馬斯克傳】,做會議紀要、周報、寫作助手,而且還可以解讀財報、論文等各類檔,以及幫你手機一鍵生成PPT。同時,零一萬物宣布李開復出任萬知首席體驗官。
融資層面,截至目前,零一萬物已完成由阿裏雲領投的融資,估值已超過10億美元,躋身獨角獸行列。
距離「萬知」釋出僅隔了不到一周,今天,零一萬物CEO李開復再度進行演講,並且「破天荒」地在抖音開設新賬號進行直播。李開復(圖片來源:鈦媒體App編輯拍攝)
李開復演講主要分為三部份:零一萬物產品矩陣介紹;沈澱和TC-PMF(Technolog-Cost-Product-Market-Fit,技術成本X產品市場契合度)理論;以及最後對話問答。
首先,李開復公布零一萬物整個產品矩陣,包括開源Yi-34B、Yi-9B、Yi-VL、Yi-6B、Yi-Spark API、Yi-Medium API、Yi-Vision API六個模型組成的開源系統,閉源包括Yi-Large API、Yi-XLarge APl、2C 生產力套用 「萬知」以及更多Al-First套用。
零一萬物稱,在國際領先的底座模型之上,零一萬物實作了從套用到生態。李開復認為,這不是一個模式,不是一個產品,而是眾多的矩陣。零一萬物要讓全世界的人都能用上這個模式,肯定要顧及到開源、閉源,To B、To C等各個領域。
效能基準層面, 李開復以千億參數規模的Yi-Large為例。在第三方權威評測中,零一萬物 Yi 模型在全球頭部大模型的中英文雙語 PK 上表現出色。在最新史丹佛評測機構AlpacaEval 2.0 經官方認證的模型排行榜上,Yi-Large模型的英語能力主要指標LC Win Rate(控制回復的長度) 排到了世界第二,僅次於GPT-4 Turbo,Win Rate更排到了世界第一。此外,零一萬物將開源Yi-34B、Yi-9B/6B升級為Yi-1.5 系列,每個版本達到同尺寸中 SOTA 效能最佳。
商業化層面, 零一萬物今天面向國內市場一次性釋出了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 介面,保證客戶能夠在不同場景下都能找到最佳效能、最具性價比的方案,Yi API Platform 英文站同步對全球開發者開放試用申請。
其中,Yi-Medium API 優勢在於指令遵循能力,適用於常規場景下的聊天、對話、轉譯等場景;如果需要超長內容文件相關套用,也可以選用 Yi-Medium-200K API,一次性解讀20萬字不在話下;Yi-Vision API 具備高效能圖片理解、分析能力,可服務基於圖片的聊天、分析等場景;Yi-Spark API 則聚焦輕量化極速響應,適用於輕量化數學分析、程式碼生成、文本聊天等場景。
李開復強調,零一萬物的千億參數模型在評測階段已超越GPT-4。而且零一萬物已經與GPT-4「並列全球第一」。
「我們也深深了解國外的大廠都在做產品更新,包括OpenAI可能不久之後也會有釋出,所以我們也不會認為今天並列世界第一是最低的宗旨,它只是一個開始,之後隨著國外模型進步,我們也會進步,希望能夠在彼此互相敦促之下,讓全世界的使用者都能享用到最好的模型。」李開復稱。
另外,對於C端套用,零一萬物透露,接入自研向量數據庫後,其C端套用在保證響應速率與準確性的前提下,成本大幅降至了原用第三方向量數據庫時的18%。在端到端 FP8 訓練的前提下,零一萬物能夠采用技術和工程手段得到與更高精度類別相媲美的訓練結果,與此同時模型訓練所需的視訊記憶體占用、通訊頻寬都極大降低。在背後,零一萬物還與輝達進行合作。
零一萬物稱,Yi-Large 訓練環節的平均 MFU(模型算力利用率)為 58%,峰值可達 63%,已顯著超越業內平均水平。多方面最佳化後,其千億參數模型的訓練成本同比降幅達一倍之多。
其次是大模型沈澱和「模基共建」等理論,以及零一萬物的發展目標。
李開復表示,在大模型時代狂飆一年後,他認為PMF 這一概念已經不能完整定義以大模型為基礎的 AI-First 創業,應當引入 Technology(技術)與 Cost(成本)組成四維概念——TC-PMF。
「做 Technology-Cost Product-Market-Fit(TC-PMF),技術成本 X 產品市場契合度,尤其推理成本下降是個‘移動目標’,這比傳統 PMF 難上一百倍。」 李開復表示。
李開復提到,可以預見AI技術未來有幾個趨勢:持續Scaling Law(尺度規律),大模型能力快速增長,超過任何技術;同時,大模型訓練和推理成本持續大幅下降(GPT價格年內多次下調);另外,需要頂級模型推理能力,才能實踐最佳AI-First套用,但有些套用會先爆發,同時要考慮推理成本和商業模式的平衡,尋找TC-PMF難度遠遠大於PMF,是大模型行業集體的挑戰和機遇。
「我覺得一定是最終產品的勝出,要靠非技術一些優勢達到口碑的傳播,比如,抖音為什麽能在這麽強大的微信之下依然能夠出來,那就是因為它在短暫的時間做了一個很棒的使用者體驗,做了一個非常好的短影片體驗,而且專註它的使用者體驗,做出了這樣一個大型的短影片市場機遇,但是今天我們一方面不能忘記PMF的重要性,而不是胡亂去燒錢。」李開復呼籲關註TC-PMF,拒絕Ofo式燒錢打法——ofo曾是中國最火爆的共享單車企業,但最終卻因為燒錢太多、無法還債導致停擺,目前全國已看不到ofo單車了。
李開復談到零一萬物的未來發展方向有四點:全球化布局、模基共建、模應一體、Al-First。
其中,零一萬物重點發力海外,聚焦生產力、社交賽道於海外套用展開探索,已有 4 款產品陸續上線。目前零一萬物海外生產力套用總使用者接近千萬,營收今年預期過億人民幣,已實踐出大模型 2C 產品的 TC-PMF——產品 ROI 為1,初步擺脫燒錢獲客,海外已產生規模化收入;模基共建重點是發力自研 AI Infra,而模應一體就是模型、產品的體系化聯動。
隨著API、萬知等套用共同構建起了零一萬物的商業落地版圖。李開復規劃,零一萬物將作為具有前瞻性的務實者一步步實作落地,並最終達到 TC-PMF,打造出 AI 2.0 時代的超級套用,實作讓通用人工智能普惠各地,人人受益。
最後一部份是對話。接近一小時中,李開復主要回應 AI 大模型行業的發展趨勢、泡沫化以及他個人在短影片上的一些布局等。
談及推理芯片, 李開復表示,「我認為國產訓練芯片和推理芯片都要全力支持,但是兩個的差別是比較大的,因為訓練芯片還是有一定難度,主要還是CUDA;而推理芯片它的幾個好處,一個是它本身比較簡單,第二它沒有CUDA這麽強的依賴性,制造過程也不難,所以我們對國產推理芯片是看好的,我們也會在合適的時候去采用,我們在創新工場也一直在關註這方面的投資機會。」
對於獨角獸的發展機會, 李開復認為,OpenAI從獨角獸做到超級獨角獸,而零一萬物有自己的特點,是可以走出一條適合自己的路。相對於追逐GPU,零一萬物的模式可能會更務實一點。
「我們是務實的AGI信仰者,所以我們一定要用最少的芯片最低的成本訓練出我們能訓練最好的模型,同時我們會不斷的去摸索找這個TCM。國內初創公司相對矽谷公司的一個差異,我們能夠仰望星空,但也能腳踏實地;第二怎麽把推理成本做到最低,讓我們能點燃。第三是找到PMF需求,因為如果大家談大模型的時候,往往會覺得說美國這方面論文寫的最多、人才密度最高,這都是毋庸置疑的,但是同時你要考慮到,做一個偉大的大模型公司,它不只是底層,底層當然不能差。我們當然相信AGI會發生,我們也希望我們能推進AGI的發生,但AGI是夢想,但是你用夢想去指點一個公司的執行,而你又沒有這種財力去做一個超級大力出奇跡,其實就是徒勞無功的事情。」李開復稱。
李開復認為,如果一年降低10倍的推理成本,2年100倍,所以有100倍的推理成本下降,假如只要今天GPT 1/100的價錢來做推理成本,很多套用肯定是可以爆發的。
談到國內大模型C端商業化, 李開復回應鈦媒體App稱,當前零一萬物主要以國外為主,海外使用者已經有付費意願。但對於國內來說,今天萬知還沒有收費計劃,因為要考慮給使用者帶來的價值。」至於整個行業使用者是否願意對某些功能或產品付費,我們還在觀察中,國外的是已經進入了一個roi為正的狀態,也就是國外我們去買的流量是低於我們能夠收到的訂閱費用,所以沒有比這個更好的。」
「已經有使用者自己掏腰包買單,所以我們對此有相當大的信心可以做到(C端商業化)。」李開復稱。
談到個人抖音賬號規劃, 李開復表示,此前一直沒做影片號,如今做,主要是認為很有必要,一部份是因為有技術產品希望和大家分享,以及科普 AI 領域的重要性,「我也希望能夠用我的抖音號來做一個非常實誠的分享,然後讓大家了解怎麽去把這個工具用好,別只看到會不會取代我們的工作」。
李開復暗示,零一萬物接下來可能會做類似 AI 搜尋的產品服務,更多聚焦於生產力效率的提升。
至於其他方向,他認為,未來 AI 大模型需要看使用者的黏性很強,傳播力很強的賽道,然後去找商盈利性,與流動互聯網商業化有些類似。「所以流動互聯網最終出了影片月費模式,我們也要在 AI 領域找到。流動互聯網誕生出抖音、微信、滴滴、美團,因此在 AI 領域,我們要不斷去探索哪些領域技術足夠好,推理足夠便宜,使用者需求足夠強。而付費層面,再用別的商業模式的挖掘。」李開復表示。
最後,關於月之暗面CEO楊植麟套現數千萬美元話題, 李開復表示,「我之所以做這件事情(零一萬物),這是我40多年的夢想,從我申請博士論文的前一年,這才是催化推動我的努力的主要動力。至於變現,我還確實跟投資人一年前做了一個承諾,基本是一個自願主動的承諾, 就是我10年不套現。 對於我的原創和團隊,當然他們比我年輕,也會經過各種手段,但是我會讓他們能夠合理得到套現,但更重要的是,最好的套現方式是趕快上市,這個是我們未來兩年會努力的目標。」
鈦媒體App了解到,零一萬物仍在規劃下一輪融資,同時啟動新的效能最強大模型Yi-XLarge MoE研發,從而推高下一代模型的效能和創新。
(本文正選於鈦媒體App,作者|林誌佳,編輯|胡潤峰)