歐洲「OpenAI」叒融資6億刀，成立1年估值60億刀，他們只做了一件事

2024-05-11科技

文｜李然李苗

編輯｜李然

封面來源｜Mistral AI官網

「Open AI 歐洲版」Mistral AI又融到一筆巨款，讓本就富裕的家庭錦上添花。

華爾街日報報道，法國AI獨角獸Mistral AI即將獲得新一輪6億美元的融資，目前估值達60 億美元，比半年前翻三倍。據知情人士透露，現有股東General Catalyst和Lightspeed Venture Partners預計將成為新一輪融資的最大投資者之一。

來源：華爾街日報

天下武功唯快不破。無論是產品交付還是融資節奏，Mistral的效率都高得驚人。

2023年4月底成立，花1個月寫了7頁PPT ，6月份，Mistral首輪融資1.13億美元。

半年內，Mistral釋出了開源的Mistral 7B和MoE模型Mixtral 8x7B Instruct。年底，這家僅20人規模的公司就籌了約4.15億美元，估值達20億美元。

今年2月底，Mistral Large釋出，強勢對標GPT-4。同日，微軟也正式宣布與Mistral AI達成合作。

來源：X

Mistral AI的高速發展歷程堪比「爽文」，「爽文」的標題可能是：

「三句話，讓投資人心甘情願為我花六億美元。」

「從白手起家到估值60億刀，我只做對了這件事。」

「我們歐洲什麽時候才能站起來？有自己的OpenAI，我們做到了」。

1年從0到估值60億刀，他們只有一個追求——高效

Mistral AI，成立1年整，融資超過11億刀，估值達到60億刀，只做了一件事：

用最高效的方法做最高效的大模型。

技術路線：最高效的開源和閉源大模型

在公司網站對於自家產品的介紹中，他們最重點介紹的就是自己是世界上最高效的大模型提供商。

來源：官網

他們是大模型效能進入GPT-4時代之後，第一家釋出MoE構架開源大模型的公司，現在Mistral 8*22B，依然是開源大模型中標桿級別的存在。

而MoE構架最重要的特點就是能在訓練和推理的過程中大大降低算力和能源的消耗，還能提供非常高的推理效能。所以Mistral推出的8*7B開源模型才能做到6倍於Llama2 70B的推理效率。

而在閉源模型中，他們家的模型的價格也同樣是第一梯隊模型提供商中最優惠的。

來源：官網

Mistral-Large的價格和GPT-4 Turbo相比，打了4折。

來源：官網

和Anthropic的Claude 3超大杯相比，更是差不多打了2折。

來源：官網

雖然API價格的定價相對復雜，除了實際成本之外，還有很多考慮因素。但是Mistral AI在能力相對接近的條件下，為客戶提供4折甚至是2折的價格選項，足以說明他們的閉源模型在推理能效方面是第一梯隊模型提供商中是非常有優勢的。

這種技術路線上體現出的效率優勢，也許正是投資人看中他們的產品和能力的一個非常重要的特點。

融資和交付最為高效的大模型公司

2023年5月，3位創始人拿著7頁PPT開始了他們創業之旅。整整一年之後，讓我們看看他們做出了些什麽成果：

2023秋天釋出Mistral-7B，一個磁力連結，沒有花哨的宣傳，開源社群為之瘋狂。

來源：X

2個多月後，一個磁力連結丟出Mistral 8*7B。

來源：X

網友感嘆，「谷歌強在釋出，Mistral強在交付」

來源：X

又過了差不多3個月，Mistral釋出了自己的閉源模型全家桶，Mistral-Large，Mistral-Medium，Mistral-small。模型API服務隨之上線。超大杯能力對標GPT-4。

4月10日，還是一個磁力連結，Mistral 8*22B效能接近GPT-4，開源社群從此站起來了。

至此，Mistral AI用一年不到的時間，從3個人4張PPT，一路高速彎道超車，一己之力完成了開源閉源接近SOTA的模型交付。

一家20人的公司用不到1年時間，把OpenAI（能力比肩GPT-4）+谷歌（大中小杯閉源模型）+Meta（引領開源社群風潮）3家公司從Transformer誕生至今所有和大模型有關的裏程碑都走了一遍。

這家法國公司的交付效率，讓所有矽谷大廠都為之汗顏，也就難怪投資人上趕著給他們送錢了。

來源：網路

人效驚人！有多少員工就估值多少億刀的神話

Mistral AI如此高的交付效率，如果放在大廠，還能靠堆人頭堆出來。

而誇張的是，Mistral AI這一年時間大部份時間，團隊人數都保持在20個人左右，大部份交付的成果都是在20人團隊規模時完成的。

算上種子輪，Mistral AI一年時間總共經歷3次融資：3個人估值4億刀，20人團隊估值20億刀，60人團隊估值60億刀。

每次融資估值數和團隊人數之比都高度一致：平均1人值1億刀！

可以說，Mistral AI在組織架構效率層面取得的成績，也是行業最一流的。

可以和OpenAI做個簡單的對比就能看出Mistral的組織到底有多高效。

根據彭博社一個月前對於OpenAI COO的采訪，現如今OpenAI的雇員數差不多有1200人，最近一次對外融資時的估值差不多是950億美金。

來源：維基百科

Mistral AI人員/估值比甚至超過了行業中最火的公司，足以看出他們在人員效率上的優勢。

做最高效的大模型，用最高效的方式做大模型，成立最高效的組織做大模型。

實用主義無神論者，把「高效靈活」刻進創業基因

Mistral的三位核心創始人曾是校友，在工作後紛紛成為令人羨慕的的矽谷技術精英。

來源：華爾街日報

△Arthur Mensch （中） Timothée Lacroix （右）Guillaume Lample （左）圖源：Medium

創始人Arthur Mensch 曾在谷歌擔任高級研究員，而 Timothée Lacroix 和 Guillaume Lample在Meta的LLaMa團隊，當前分別在Mistral AI任技術長和首席科學官。

Mensch 曾對媒體表達過離開谷歌的原因是因為其「不夠創新（innovative）」——嫌棄大公司效率低下。而 Lacroix 和 Lample 因為Meta公司內部的原因，也離開了。

來源：網路

在人工智慧創業領域，Open AI和谷歌等大模型巨頭已經形成馬太效應。比起簡單直接的商業場景落地，做模型似乎已經成了一件吃力不討好的事。

但是，不要小看創業者的羈絆。

Mensch曾在采訪中表示，他與Lample 和Lacroix從學生時代起就認識，友誼已經超過了十年。

在30出頭的年紀，他們決定趁著風口給這個世界一點小小的震撼。三人聯手在法國創辦了Mistral AI並成長迅速，成為Open AI有力競爭者之一（起分碼走了微軟的青睞）。

最初的願景是搓出一個「更有用的AI」。

來源：網路

Mensch是個無神論者，他沒有「造神」的意願，只相信「有用」的力量。他曾公開表示自己「區別於別的AI創業CEO」（指馬斯克和山姆·奧爾特曼），並對矽谷中彌漫的「關於通用人工智慧的宗教迷戀感到不適」

人們告訴我人工智慧要淪陷世界了 vs 我的神經網路來源：X

「整個通用人工智慧的言論都是關於創造上帝，」米斯特拉爾在接受采訪中說。「我不相信上帝。我是一個堅定的無神論者。所以我不相信通用人工智慧。」

Reddit網友對此新聞評論：老兄，我只是想簡單地活著，不用擔心賬單而已。

追求實用、靈活和高效的目標刻在Mensch的從業基因裏。Mensch 在 Google 的 DeepMind 團隊主要負責retrieval工作。他發表過 21 篇有關語言模型的 ArXiv 論文，是 RETRO、Flamingo 和 Chinchilla 計畫的主要貢獻者

圖源：Arthur Mensch領英頁面

這三個計畫都與大模型的效率提升有關。擅長機器學習視覺化的知名部落格作者Jay Alammar曾詳細分析了Mensch參與搭建的的RETRO（Retrieval-Enhanced TRansfOrmer）模型。該模型與GPT-3效能相當，但參數量僅為 GPT-3 的4%。

在算力和數據吃緊的當下，增大模型不是提高效能的唯一選擇。RETRO模型能如此高效的原因在於它將語言資訊和世界知識資訊區分開了，並加入了檢索來增強效能。

用檢索方法輔助語言模型減少了語言模型在其參數中編碼所需的資訊量，在文本生成中表現良好。圖源：Jay Alammar 的技術部落格

Flamingo是一個視覺模型，僅使用少量帶註釋的範例來構建可以快速適應新任務。

來源：arXiv

而Chinchilla模型則大大簡化了下遊利用，因為它可以減少推理和微調所用到的算力。

Mensch創辦Mistral AI的理念其實和他的工作內容是一脈相承的：多快好省地建設AI模型。

在商業化方面，靈活、便攜、價效比也被Mistral AI所強調。

比起市面上其他公司，Mistral的不同之處在於其人員攜行式解決方案。它可以透過API配合雲服務作為SaaS使用。最重要的是，它也可以作為一個平台進行本地部署。

Mensch曾在5月2日接受采訪時驕傲地表示：「如果您擁有私有雲，並且想要高度客製工作負載，或者您是在本地執行，那麽我們基本上是唯一的解決方案之一。這一切都與我們願意廣泛分享技術有關。反過來，這也正是我們開源的原因。」

短短一年時間，在模型能力上做到有開源也有閉源；在商業化套用上，有本地部署，也有外部雲服務。

靈活的唯物主義六邊形戰士Mistral AI在歐洲「開卷」，六十億的新估值是這條鯰魚應得的。