當前位置: 華文世界 > 科技

阿裏通義千問技術骨幹出走創業,曾帶隊研發通義大模型「前身」M6

2024-07-18科技

本文來源:時代周報 作者:郭美婷

7月18日,據知情人士向時代周報記者核實,阿裏通義大模型團隊技術骨幹周暢將於近日離職創業。

據悉,周暢屬於正常離職,目前,阿裏通義實驗室負責人為周靖人。周暢離職後通義大模型的研發和開源工作將繼續向前推進。

在7月初的2024世界人工智慧大會上,周靖人曾公布,近2個月通義千問開源模型下載量增長2倍,突破2000萬次。

時代周報記者綜合梳理公開資料顯示,周暢花名鐘煌,本科就讀於復旦大學電腦科學與技術系,2012年進入北京大學,2017年拿下北大電腦軟體與理論博士學位。2017年7月,周暢加入阿裏巴巴。按中國兒童6周歲上學的慣例計算,周暢極有可能是位年輕的90後。

截至今年7月18日,時代周報記者翻看周暢的領英帳號,仍顯示其為阿裏巴巴資深演算法專家。

截圖自周暢領英帳號頁面

2022年10月,周暢曾受邀回母校演講。共青團北京大學委員會官方微信公眾號顯示,彼時周暢在阿裏巴巴達摩院智慧計算實驗室任職,擔任高級演算法專家,研究興趣包括表征學習、多模態預訓練、推薦系統。

據介紹,周暢當時已在機器學習、資料探勘、資料庫領域國際頂級會議(CCF-A類)上發表30余篇文章。帶領團隊研發了十萬億多模態預訓練模型M6系列,以及通用多模態AI模型OFA系列;研發了大規模GNN訓練平台AliGraph。

據了解,M6模型是2021年3月阿裏巴巴與清華大學聯合釋出的業界最大中文多模態預訓練AI模型。據阿裏雲當時介紹,M6模型參數規模高達1000億,是多模態預訓練領域史上最大的模型。

在阿裏雲關於M6模型釋出的推播下,周暢曾留言稱:"歡迎廣大英才加入我們的團隊繼續這項工作!"

如今更為公眾所熟知的阿裏雲通義大模型,某種程度上可以說是在M6模型的基礎上沿襲而來的。

圖源:截圖自阿裏通義千問2.5對話

2022年,中國電子學會公布「2021中國電子學會科學技術獎」名單,其中浙江大學、達摩院、阿裏雲完成的「超大規模高效能圖神經網路計算平台及其套用」獲得科技進步一等獎,主要完成人裏面就包括楊諾爾、周靖人和周暢等。如今,楊諾爾早已於2022年離職,周暢也將離職下場創業。

圖源:截圖自阿裏雲公眾號

周暢在此之前已密切關註大模型與終端的結合。

去年底,周暢曾作為阿裏巴巴-通義實驗室、通義千問大模型負責人,受邀出席了首屆AI PC產業創新論壇。當時,周暢分享了關於端側大模型的技術進展,以及終端裝置與AI結合的發展前景。

周暢表示,大模型技術的快速叠代已經讓其具備理解世界的基本能力,接下則需要想辦法讓大模型能力在各種環境和場景下被充分使用起來。例如,讓大模型在PC等終端裝置上跑起來,正是普惠終端使用者的第一步。

圖源:截圖自聯想官方公眾號

關於周暢未來創業的去向,業內傳出訊息稱他將聚焦於AI套用層面。

「盡管周暢具體創業細節尚未全盤公開,但他在深度學習、圖挖掘以及分布式計算方面的專長,或許預示著他將在相關領域或其交叉領域探尋全新的商業契機。」天使投資人、資深人工智慧專家郭濤猜測,諸如基於大數據的智慧分析、自動化決策支持系統,抑或最佳化現有的 AI 模型以適配更為廣泛的行業套用等,皆為潛在的創業指向。

時代周報記者就周暢具體的創業方向,以及是否將在阿裏體系內孵化等問題向阿裏雲方面詢問,截至發稿未得到回應。