當前位置: 華文世界 > 科技

阿裏大模型技術骨幹周暢被曝離職,投身AI創業

2024-07-18科技
西風 發自 凹非寺量子位 | 公眾號 QbitAI
阿裏通義千問大模型技術骨幹周暢,被曝將離職創業!
有知情人稱,周暢雖現在還在阿裏雲系統中,尚未正式離職,但已確定離職意向。
下一步,據36Kr率先報道:周暢或劍指AI套用創業,具體方向還未可知。
作為阿裏7年資深演算法專家,周暢將離職這一訊息引起圈內廣泛關註。
訊息稱通義大模型的研發和開源工作仍正常繼續,通義實驗室負責人為阿裏雲CTO周靖人。
最近不少大廠AI骨幹被曝單飛,也有不少創業計畫都逐漸浮出水面,AI引起的創業浪潮也還在繼續。
通義大模型發展的親歷者和見證者
周暢,花名鐘煌,阿裏通義千問大模型技術骨幹之一,曾和團隊推出一系列語言模型、多模態模型。
團隊研究成果也曾拿下中國電子學會科技進步一等獎等諸多榮譽。
2012年,周暢畢業於復旦電腦科學與技術系,之後進入北大,2017年拿下北大電腦軟體與理論博士學位。
主要研究方向包括圖表征學習與推理、推薦系統、分布式圖計算等。
資料顯示,2017年7月,周暢加入阿裏巴巴,曾任達摩院智慧計算實驗室高級演算法專家。
在阿裏期間,周暢學術成果頗豐,一籮筐論文被各大頂會收錄,谷歌學術被引8000+:
2017年至今7年間,周暢可謂見證並參與了阿裏大模型的關鍵演變。
作為國內大模型代表,阿裏最初曾先後推出structBERT、M6等系列大模型,直至如今,通義千問模型家族逐漸壯大。今年5月,通義千問模型已前進演化到了通義千問2.5。
最近難倒一眾大模型、火爆沖微博熱搜的「9.11和9.9哪個大」問題,在量子位的測試中,也沒能難倒通義千問2.5。
量子位相關文章底下評論區也有不少網友表示通義千問可以成功做對:
阿裏的開源模型系列也在持續更新。
去年8月,通義宣布加入開源行列,而後陸續推出十多款模型,參數規模橫跨5億到1100億。
還開源了視覺理解模型Qwen-VL、音訊理解模型Qwen-Audio、程式碼模型CodeQwen1.5-7B、混合專家模型Qwen1.5-MoE。
目前通義開源模型系列下載量已經超700萬。
今年6月,阿裏通義千問開源大模型前進演化到了Qwen2,效能全面超越開源標桿Llama 3,釋出兩小時,沖上HggingFace開源大模型榜單第一。
知情人稱,周暢離職,通義大模型的研發和開源工作仍會正常繼續,通義實驗室負責人為周靖人。
AI大牛創業公司接連湧現
除周暢外,近期還有不少大廠核心骨幹被曝離職,不少大佬的創業計畫也陸續公開。
這兩天,前百度研究院副院長、百度認知計算實驗室主任李平被曝離職,創立專註於AI基礎設施的公司,名為vecml,並任CEO。
「AI教母」李飛飛首次創業成立的World Labs也有新訊息,已突破10億美元估值,不到4個月成為新晉獨角獸。
△李飛飛實驗室在空間智慧領域的最新進展
再往前,前螞蟻集團副總裁漆遠創業方向被揭秘,產學研並列創立大模型公司無限光年,被曝劍指「可信大模型」。
李沐,辭去亞馬遜首席科學家一職,共同建立Boson.ai,目前已經推出了第一個大模型成果。
谷歌、Deepmind等也有一眾工程師離職,圍繞大模型多個方向創業。
OpenAI創始成員、前特斯拉AI主管Andrej Karpathy(Kappa西)近期也官宣創業了,投身一家AI原生的新型學校Eureka Labs。
大佬們紛紛入局,給未來大模型格局又增添了許多新的變數。