當前位置: 華文世界 > 科技

阿裏通義千問技術骨幹周暢確將離職,尚未last day

2024-07-18科技

機器之心報道

機器之心編輯部

昨日,有市場訊息稱,阿裏通義千問技術骨幹周暢(花名:鐘煌)已離職創業。據機器之心訊息,周暢確將離職,但還未到最終離職日期。

周暢是通義千問大模型的重要人物。2020-2021年間,他帶領團隊設計並實作了超大規模的多模態預訓練模型M6,在參數數量和低碳訓練模式上取得了突破。今年,通義千問開源模型 Owen1.5-72B 在 HuggingFace 模型表現榜單上(ChatArena)成為開源模型第一,也是開源社區普遍使用的模型系列之一。

更早之前,周暢在達摩院期間在多個專案中發揮了重要作用,如研發超大規模商品圖表征演算法 APP、使用者表征框架 ATRank、基於自監督對比學習的向量召回演算法 CLRec 系列等。

周暢本科於2012年本科畢業於復旦電腦科學與技術專業,2017年博士畢業於北京大學電腦軟件與理論專業,透過校招加入阿裏巴巴,在阿裏履職超過八年。

他專攻領域為深度學習、圖挖掘和分布式計算,在機器學習、資料探勘、數據庫領域國際頂級會議上發表 30 余篇文章,並擔任 NeurIPS/ICML/KDD/WWW 等學術會議的審稿人。周暢團隊研究成果曾獲得中國電子學會科技進步一等獎、杭州市領軍型創新創業團隊等獎項和榮譽。

據職場Bonus援引阿裏內部人士對周暢的評價是:「他很想做成通用型更強的大模型,而不是垂直於單一領域和場景」。

目前,周暢本人暫未對接下來的計劃做出回應。

關於通義千問

通義千問是阿裏巴巴通義實驗室自主研發的超大規模語言模型,通義實驗室是阿裏巴巴集團旗下的自然語言處理實驗室,致力於研究和開發通用的自然語言處理技術,為阿裏巴巴集團旗下各業務部門提供智能化的語言處理服務。目前阿裏通義實驗室負責人為周靖人。

2023年4月7日,通義千問開始邀請測試。

2023年4月11日,阿裏巴巴所有產品未來將接入通義千問大模型進行全面改造。

2023年8月,通義千問開源了 qwen-7b 模型。

2023年9月,通義千問正式向公眾開放;同月25日,阿裏雲宣布開源通義千問140億參數模型 Qwen-14B 及其對話模型 Qwen-14B-Chat,免費可商用。

2023年10月31日,通義千問2.0正式升級釋出,通義千問 App 也隨之釋出。

2023年12月1日,阿裏雲開源通義千問720億參數模型 Qwen-72B、18億參數模型 Qwen-1.8B 及音訊大模型 Qwen-Audio。至此,通義千問實作了「全尺寸、全模態」開源,共開源18億、70億、140億、720億參數的4款大語言模型,以及視覺理解、音訊理解兩款多模態大模型。

2024年1月4日,通義千問 App 上線「通義舞王」功能。

2024年1月26日,通義千問視覺理解模型 Qwen-VL 推出 Max 版本。

2024年3月22日,向所有人免費開放1000萬字的長文件處理功能。

2024年3月29日,開源首個 MoE 模型 Qwen1.5-MoE-A2.7B。

2024年4月3日,通義靈碼正式上線通義千問 APP,並向全民免費開放。

2024年4月7日,開源320億參數模型 Qwen1.5-32B。

2024年4月28日,推出千億級參數模型 Qwen1.5-110B。

2024年5月9日,釋出通義千問2.5大模型並更名為通義。

截至2024年5月,通義千問提供了8大行業模型,涉及編程、閱讀、音影片處理、角色創作、金融、客服、健康、法律等領域,可套用於寫程式碼、讀程式碼、查BUG、最佳化程式碼、獲取長文本提要和概述、音影片內容處理、個人化角色創作、解讀財報研報、分析金融業事件等場景。