2月19日訊息,AI初創公司「月之暗面」於近期完成了新一輪融資,金額超10億美元(當前約合72億人民幣),投資方都是中國頭部企業,包括紅杉中國、小紅書、美團、阿裏等。這也是自ChatGPT爆火以來,國內AI大模型公司迄今獲得的單輪最大金額融資。
月之暗面(Moonshot AI)成立於2023年3月,剛成立的2023年就已獲得了超2億美元(約合14億人民幣)融資,投資方包括紅杉中國、真格基金等。在本輪融資後,月之暗面估值已達約25億美元(約合180億元人民幣),為國內大模型領域的頭部企業之一。
這樣高的估值、融資,除了得益於AI大模型熱之外,離不開創始團隊。
據公開資料顯示,公司核心成員多出身清華系,創始團隊核心成員參與了 Google Gemini、Google Bard、盤古NLP、悟道等多個大模型的研發,多項核心技術被Google PaLM、Meta LLaMa、Stable Diffusion等主流產品采用。
據公開資訊來看,聯合創始核心團隊主要有5人。
首先是主要創始人兼CEO,楊植麟(持股78.96%),清華大學交叉資訊研究院助理教授,今年32歲。在高中時,毫無編程經驗的楊植麟透過選拔參加奧賽,並成功拿到清華入場券。受到保送限制,最開始楊植麟並非學電腦,直到大二才轉入電腦系師從IEEE Fellow唐傑。2015年,以年級第一的優異成績從清華大學電腦系畢業。
隨後楊植麟又進入卡內基梅隆大學電腦學院(美國第一電腦學院)學習。2019年,在蘋果AI研究總監Ruslan Salakhutdinov 和谷歌首席科學家William W. Cohen的指導下,獲得博士學位。一般來說,卡內基梅隆大學電腦專業的博士生往往要經過6年才能畢業,而他僅用了4年。
在讀博期間,2018年,楊植麟還作為第一作者,與圖靈獎得主楊樂昆合作發表了論文「GLoMo: Unsupervised Learning of Transferable Relational Graphs」 ;
與圖靈獎得主約書亞·本吉奧(Yoshua Bengio)合作發表論文「HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering」。
2019年又作為第一作者,與谷歌、卡內基梅隆大學聯合發表:XLNet: Generalized Autoregressive Pretraining for Language Understanding。以及:Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context兩篇論文。
其中Transformer-XL成為首個全面超越RNN 的註意力語言模型,論文成為NeurIPS 2019與ACL 2019的最高引論文之一。XLNet則在20項任務上超越谷歌BERT模型。
同時入選了2019年度北京智源青年科學家。2020年11月,榮登「2020福布斯中國30歲以下精英榜」。2022年4月,入選AI華人青年學者榜單。
在美國期間,楊植麟還曾在Meta AI和Google Brain工作,分別與Meta AI研究科學家Jason Weston和 Google Brain的創始成員Quoc V. Le一起工作。
天才總是善於突破。楊植麟曾這樣說:「我想有一條更激進、更徹底的路徑去打破學術界與工業界的壁壘。」
早在博二時(2016 年),楊植麟就開始了第一次創業,創立了迴圈智能(Recurrent AI)。2019年楊植麟畢業回國,回到母校清華大學任交叉資訊研究院助理教授的同時,還繼續統領著迴圈智能,負責純演算法研發。2021年,迴圈智能還與華為雲合作開發了千億級NLP大模型盤古大模型,涉及NLP、CV 等多個方向。
雖然楊植麟長期都頂著天才的光環,但在也並非一帆風順。楊植麟的論文Transformer-XL也曾一度被ICLR 2019拒絕,理由是評審不認為大語言模型的提升在實際場景會有更多的價值。但楊植麟始終堅信自己已經看到AI的第一性原理。
回國後,楊植麟也一直試圖整合重新組建一家相關AI公司,自己團隊提供技術,對方提供算力等資源,但一直受限。隨著ChatGPT的爆火,也讓楊植麟看到了機會,他獨自去海外考察了兩個月,讓他堅信,在亞洲做一個大模型公司,有機會了。
2023年3月1日正式成立,至於公司為何叫「月之暗面」。楊植麟本人曾透露,在學生時代組過樂隊,在他看來搖滾精神與技術創業相通。公司成立之時也正好是英國搖滾樂隊Pink Floyd專輯The Dark Side of the Moon發行50周年。同時「月之暗面」還意味著神秘,令人好奇和向往,但登月又是一件難度很大很有挑戰的事情。
公司創始團隊除楊植麟外,還有兩位聯合創始人,周昕宇、吳育昕,也都是清華畢業的同學。
其中,周昕宇持有公司10%股份為第二股東。周昕宇是一位風險喜好者,對於他來說挑戰越大就越興奮。大三快結束時,是就業還是讀書,最終選擇了工作。大四時,周昕宇加入了人工智能產品和解決方案公司曠視科技實習,並在畢業之後正式加入,工作內容是演算法量產。在剛加入曠視之後,他做了很多工作,別人覺得他做得很雜,但在他的邏輯體系裏是統一的,那就是為了提高生產力這個目的。
周昕宇曾說:「搞深度學習做的90%的事情可能都是在試錯,因為本質上我們做技術是在和天鬥。」
工作期間,他還與曠視研究院基礎科研負責人張祥雨,攜手研究了移動端模型,並共同撰寫了ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices,中標CVPR。後來還影響了包括蘋果3D人臉解鎖在內的各種手機毫秒級人臉解鎖技術。
吳育昕作為持股5.96%的第三大股東,和楊植麟基本上是相同的人生軌跡,他們都畢業於清華與卡內基梅隆,也都曾在Google Brain(從事基礎模型)和Meta AI(電腦視覺)工作,是Meta人工智能實驗室FAIR團隊的一員。
在FAIR的作品曾獲得ECCV 2018 的最佳論文榮譽獎、CVPR 2020的最佳論文提名以及 ICCV 2021的Mark Everingham獎。還建立了Meta AI最受歡迎的專案之一detectorron2,被廣泛使用的視覺開源專案並被整合到Meta全線VR/AR產品中。
2018年10月的GeekPwn國際安全極客大賽上,IYSWIM是6個參賽團隊中,唯一一個破解人臉辨識演算法的團隊。吳育昕當時以IYSWIM團隊的身份參賽,據他介紹,「自己(以個人名義報名參賽,有名隊友沒有來到現場)用了谷歌的FaceNet開原始碼模型攻破了該演算法」。
和楊植麟同樣師從唐傑教授的張宇韜,持股5%。此前還與楊植麟一起建立了迴圈智能。據悉,張宇韜本碩均在清華大學電腦系就讀。是清華大學數據科學研究院科技大數據研究中心首席研究員。研究方向為異構數據融合及知識圖譜構建。在KDD、CIKM、VAST等資料探勘領域國際重要會議上發表多篇論文。
曾作為核心開發者研發了全球知名的科技大數據分析平台AMiner,產品服務於BATH等科技巨頭及國家科技部等政府科研管理機構。曾獲得北京市科學技術一等獎、吳文俊人工智能技術進步一等獎,阿裏巴巴天池大數據競賽全球第二名。
除了清華四人組之外,在月之暗面股東名單中還有一位畢業於復旦大學電腦科學系的汪箴。從復旦畢業後,又就前往新加坡南洋理工大學電腦工程系就讀。他有著二十年軟件開發工作經驗,目前主要研究工作面向 AI 在鑒證科學上的套用。
據悉,汪箴曾在谷歌擔任高級軟件工程師/技術主管,iHealth Labs 系統架構師,iSeed Ventures 副總裁以及新加坡政府科技局 Smart Nation Fellow/傑出工程師。同時也是新加坡AI技術驅動獨角獸領創集團(ADVANCE.AI)技術長。此前還有過投資機構的從業經歷。
除了這四位主要核心人員外,月之暗面還吸納了大量參與過Google Gemini、Google Bard盤古NLP、悟道等多個大模型的研發人才。在2023年10月有50人左右,目前團隊人數已超80人。
雖然團隊人數不多,但在公司成立幾個月後,2023年10月就推出全球首個支持輸入20萬漢字的智能助手產品Kimi。核心特色是,相較市面上以英文為基礎訓練的大模型服務,Kimi Chat具備較強的多語言能力,20萬漢字的輸入在中文上也更具備優勢。
當前,月之暗面正研發通用多模態模型,預計年內推出。對現在的大模型創業公司而言,多模態模型確實是核心競爭點。尤其是OpenAI 首個AI 影片模型Sora的釋出,再次給一一賽道添了一把火。但相較於文本,影像、影片等多模態模型訓練成本均更高,需要的資金和人才也更多,月之暗面再次融資,或許也是為此在做準備。