國產大模型首超GPT-4o！零一萬物「閃電」奇襲全球AI企業

2024-10-18科技

來源：港股那點事

去年開始的轟轟烈烈的AI熱潮隨著整個行業的進展緩慢，似乎逐漸退潮。

然而現實是，AI浪潮只是從觀眾眼中淡去，研究的行程仍在推進。

繼今年五月零一萬物釋出千億參數模型Yi-Large後，近日，零一萬物正式對外釋出最新旗艦模型Yi-Lightning。

一經出世，便飽受業界關註。

國際權威盲測榜單LMSYS顯示，目前Yi-Lightning已超越GPT-4o。

這也意味著，僅僅花費了五個月，零一萬物就已追上OpenAI的頂級模型。

實則，早在今年6月，零一萬物創始人李開復博士在【格隆博士會客廳】的訪談中，已經對國產大模型進行過分析。

彼時他認為，中國大模型與美國頂級大模型之間的差距已經從之前的7至10年迅速縮短至僅有六個月。

而這次，Yi-Lightning超越了OpenAI在2024年5月推出的GPT4o，也就是說，中美大模型的差距進一步被縮短到了5個月。

仔細來看，在分類榜上，Yi-Lightning各項能力都名列前茅。

在中文能力上，Yi-Lightning躍居並列第二，和o1-mini相差無幾。數學能力，Yi-Lightning和Gemini-1.5-Pro-002並列第3，僅次於o1-preview、o1-mini。

在程式碼、Hard Prompts、Longer Query等能力上，Yi-Lightning也都位列前五。

對比五個月前釋出的Yi-Large，Yi-Lightning首包速度提升1倍，推理速度也提升了4成，可謂進步飛速。

在這次的釋出會上，除了釋出新模型，零一萬物還先發了AI 2.0數位人方案並公布了零一萬物在B端產品上的最新進展。

李開復稱，零一萬物最新旗艦模型Yi-Lightning的API價格已降至極低水平，每百萬token僅收費0.99元。

早在今年5月，字節、百度、阿裏雲、騰訊、訊飛等大模型廠商紛紛大降價，曾經引起了不小的爭議。

當時李開復在釋出大模型系統時曾表示，其認為大模型之間搞類似於ofo的流血打法是雙輸的策略。

這次釋出會再次談及之前的「價格戰」，李開復仍舊表示不認可，他認為，當時有很多效能很差的模型價格都降得非常低，甚至是免費，但讓接入的企業和個人體驗起來都不達預期。

而針對此次零一萬物的大模型降價和外界關於零一萬物虧錢拉客戶的質疑，李開復稱，零一萬物大模型的真實成本比0.99元低，還有利潤空間。

此前，OpenAI官宣獲得66億美元融資，估值突破1500億美元。隨後，媒體報道稱，經過對OpenAI財務數據的分析，推測其會在2029年實作盈利。

但在此之前，OpenAI仍會保持較為嚴重的虧損，預測2026年虧損振幅將達到140億美元。

作為AI領域絕對的龍頭，OpenAI尚且如此，其他企業或許更加艱難，特別是國產大模型初創企業。

月之暗面、百川智慧、智譜AI、Minimax、零一萬物、階躍星辰，這6家中國大模型初創企業被稱為國內的「AI六小虎」。

然而月初，有媒體報道，「AI六小虎」中有兩家已經逐步放棄預訓練模型，縮減了預訓練演算法團隊人數，業務重心轉向AI套用，而零一萬物就是其中一家。

而李開復回應稱，盡管預訓練既是技術活也費錢，但目前「AI六小虎」做預訓練仍不成問題。

同時他還提到剩下的5家公司，他表示「這6家公司融資額度都是夠的，我們做預訓練production run，一次花費三四百萬美金，這個錢頭部公司都付得起，我覺得中國的6家大模型公司只要有夠好的人才和想做預訓練的決心，融資額跟芯片都不會是問題。」

這對於國內的大模型公司或許是一個好的跡象，但國產大模型仍在尋找方向。

剛剛過去的9月，OpenAI釋出了OpenAI o1系列模型，被業界稱為是AGI一大新行程。

李開復認為，OpenAI內部其實攢了很多好東西，除了OpenAI o1以外，OpenAI領先行業足夠多，但會等待合適的節點再釋放。

放眼現在的AI行業，早已度過了最開始的狂熱階段，但不管是國外還是國內的AI公司，都在暗流中繼續前進和競爭。

目前，國內的大模型主要分為兩類，一類是基礎通用大模型，比如文心一言、通義千問等等，一類則是專註各類細分賽道的大模型，金山的政務大模型，一些公司的醫療、金融等等。

工業和資訊化部近日釋出的最新數據顯示，目前中國完成備案並上線為公眾提供服務的生成式人工智慧服務大模型已經近200個，註冊使用者超過6億，產業相關企業數量超過了4500家。

如果單從數位上看，國產大模型的技術成長可謂相當飛速。

且SuperCLUE的評測結果顯示，國內絕大部份閉源模型已超過GPT-3.5Turbo，在技術上和國外大模型的差距不斷縮小。

然而，對於國產大模型，不少人仍舊心有疑慮，因為這樣的對比對於AI的商業化來說並無意義，更為重要的，是如何對AI進行套用。

盡管各家大廠、垂類企業以及初創公司都在鉚足了勁鉆研技術，較量日活，不斷追求更大的數據量、更強的計算能力以及更復雜的模型訓練，但國內市場仍舊缺乏能夠承載AI的殺手級套用。

也是因此，在國內大模型技術不斷提升的同時，普通人對於AI技術力提升的感知卻逐漸減弱，市場對於AI的熱情也逐漸削減。

絕大多數人難以體會到95%到99%這一階段的技術提升，唯一能夠讓人感受到AI技術提升的是，AI在逐漸被運用到什麽日常領域之上，究竟帶來了怎樣的生產力提升。

因此我們可以看到，盡管在不少垂類行業上，AI愈臻完美，套用也越來越普遍，但反而是在高日活、高個人化的APP上，AI難以施展拳腳。

例如，盡管抖音的豆包等一系列AI已經較為成熟，但是對於抖音的生態本身，並沒有帶來更大的改變。

因為抖音已經對於使用者畫像進行高度區分，套用中需要的是超高的客製化和精準化需求，而目前的AI還很難做到這一點。

對於大模型企業來說，相比提升技術力，更為困難的是，如何將AI的技術力，轉換成企業乃至個人能夠實實在在體會到的生產力。

而這，或許也該是未來大模型企業們努力的方向。

正如互聯網出現之後被國人迅速開發，發展出各類新業態，在互聯網的套用上，國內一直位於國際領先的地位。

未來，國內大模型企業的出路，也將在套用中逐漸體現。