當前位置: 華文世界 > 科技

發力語音互動,月之暗面納入前微軟強將 AI玩家中誰將組成大模型「最強戰隊」?

2024-10-26科技

前沿技術的比拼中,人才極為重要。

10月24日,【每日經濟新聞】記者從「月之暗面」公司方面證實,業界頂尖的語音技術專家——微軟亞洲研究院前首席研究經理譚旭已正式加入月之暗面,將和團隊一起為Kimi使用者研發更加先進和好用的智能助手。

圖片來源:影片截圖

【每日經濟新聞】記者也註意到,Kimi近日開啟了語音通話功能的灰度測試。與之對應的是,月之暗面多次對外表態堅定追逐多模態,例如在今年5月的第五屆上海創新創業青年50人論壇上,月之暗面創始人楊植麟表示,多模態是公司當前持續的重點投入方向。

在技術飛速更新叠代的大模型領域裏,人才密度往往是公司模型、產品能否跟上腳步、進而領先競爭對手的關鍵因素。

「最重要的本質還是人。」英諾天使基金合夥人王晟曾在接受【每日經濟新聞】記者采訪時曾表示,投資AI早期專案時,考察重點在於團隊,「在(創業)方向基本一致時,投資人覺得最重要的就是團隊因素」。

招聘市場上的波動則更為直觀地反映出大模型人才爭奪戰的激烈程度。脈脈人才智庫的數據顯示,隨著ChatGPT聲名大噪,2023年3月,大模型崗位招聘指數(該數據越大,說明招聘崗位量越高)達到2023年以來的峰值,為87.15。

與此同時,頭部科技公司、互聯網大廠和明星獨角獸之間的人才流動沒有一刻不在持續著。對於這群最先踏入新時代的AI玩家來說,誰都想集結一支「最強戰隊」,去實作更多未知的可能性。

發力語音互動,月之暗面麾下再添一員大將

兩篇關於「Transformer-XL」與「XLNet」重要論文的第一作者、中國35歲以下NLP(自然語言處理)領域參照量最高的研究者——類似的諸多頭銜讓楊植麟的第二次創業在一開始就頗受業內關註。

2023年6月,月之暗面剛成立不久,就完成了超2億美元(約合人民幣14.2億元)的天使輪融資,投後估值約為3億美元(約合人民幣21.4億元)。最新的一筆融資在今年8月,月之暗面獲超3億美元融資,此輪融資也將月之暗面的估值推到了33億美元(約合人民幣235.0億元)的高位。

圖片來源:網頁截圖

人才隨著資金彈藥一起湧來。10月24日,【每日經濟新聞】記者從月之暗面方面了解到,微軟亞洲研究院前首席研究經理譚旭已正式加入月之暗面,據介紹,他「主要是幫助Kimi打造更自然、更流暢的語音互動體驗」。

公開資料顯示,譚旭研究領域為深度學習、語言/語音/音樂處理以及AI內容生成,在AI學術會議發表論文100余篇,出版學術專著【神經語音合成】。

他開發的機器轉譯系統在中英轉譯上達到人類水平,並在WMT機器轉譯比賽中獲得多項冠軍。同時,譚旭的研究成果也在Azure、Bing等微軟重要產品中得以套用。

同時,【每日經濟新聞】記者註意到,Kimi在語音功能上也有了新的進展,現已開啟語音通話功能的灰度測試。對此,月之暗面方面向記者表示,除了常規的對話之外,目前該功能還提供英語陪練和模擬面試兩個專門的對話場景。

實測Kimi、豆包和通義千問的語音功能後,【每日經濟新聞】記者發現,目前Kimi的語調、語音內容自然且口語化,但它是三者中唯一需要使用者手動打斷對話的產品,其余兩款產品均可實作智能打斷。

「智能打斷和方言、口音辨別都是在語音模型裏比較難訓練的能力。」一位大模型技術人員向【每日經濟新聞】記者表示,除了單獨訓練一個輔助實作打斷功能的模型,有端到端能力的模型可以壓縮響應時間,實作即時語音打斷。

在今年5月的OpenAI春季釋出會上,新釋出的GPT-4o展示了其更為流暢、自然和智能的語音互動功能。在帶來更新體驗的背後,是GPT-4o透過端到端訓練了一個全新的模型,能夠同時處理文本、視覺和音訊輸入輸出。

大模型人才爭奪戰進行時,誰能組成「最強戰隊」?

這是一個極度渴望人才的行業,人等同於戰鬥力。於是,頭部科技公司、互聯網大廠和明星獨角獸之間的人才流動在大模型業內屢見不鮮。

這一點從多個創業公司創始人的履歷中便可窺見一二。例如,「AI六小龍」之一的MiniMax公司的創始人閆俊傑,曾擔任商湯科技副總裁,階躍星辰創始人姜大昕曾是微軟全球副總裁、微軟亞洲互聯網工程研究院的首席科學家。

此外,類似谷歌「TensorFlow」平台前核心創始成員潘欣去年加入「零一萬物」公司擔任首席架構師、阿裏通義千問大模型技術負責人周暢離職,這樣的成熟技術人才的就職變動也是業內「尋常事」。

【每日經濟新聞】記者從字節跳動內部人士處確認,原零一萬物核心成員黃文灝在今年8月加入「Seed」團隊,匯報物件為大模型團隊負責人朱文佳。

對此,零一萬物回應【每日經濟新聞】記者表示,黃文灝離職是因有其他追求。「近期,有多位負責模型訓練、多模態和產品的,(具備)國際頂尖大廠履歷的高階負責人加入零一萬物,已經履職數月,為零一萬物的模型和產品的持續叠代升級和商業化探索註入新動能。」零一萬物方面介紹。

招聘市場上的數據也印證了各大企業對大模型人才的爭奪日趨激烈。脈脈人才智庫的數據顯示,ChatGPT的走紅迅速引發了國內市場的「搶人大戰」,2023年3月,大模型崗位招聘指數達到2023年以來的峰值。其中,技術人才最為炙手可熱。2024年1月~7月,大模型領域熱招崗位的前10位中有9個為技術崗位,演算法工程師是新發崗位量最多的。

各大團隊都以高薪向高學歷技術人才伸出橄欖枝。脈脈人才智庫的數據顯示,在大模型領域的人才招聘中,要求碩士及博士學位的崗位占比達29.66%,顯著高於新經濟行業平均水平的11.28%;據2024年1月—7月的數據,大模型領域演算法相關崗位平均月薪超6.75萬元,位居高薪崗位第一。

今年7月,字節跳動面向2024年9月至2025年8月畢業的博士群體開啟了「筋鬥雲人才計劃」,這是繼「Top Seed人才計劃」後另一AI人才專項招聘計劃;騰訊、百度等互聯網巨頭也開啟了大模型技術人才專項招聘計劃。

根據脈脈人才智庫的調研,在2024年1月—7月,大模型新發崗位量最高的10家企業中,字節跳動位列第一。字節跳動招聘官方公眾號在10月22日釋出報告稱,2025屆校招中,報錄比最高的前兩個崗位分別是大模型技術專家和AI演算法工程師(如下圖)。

圖片來源:微信文章截圖

一位業內人士向【每日經濟新聞】記者透露,目前月之暗面的規模還不足200人,「感覺大家還是在搶人才(的階段)」。古語有「兵在精不在多」,相信在大模型領域裏,無論是月之暗面這樣的創業公司還是字節這樣的互聯網巨頭,現在都對擁有更多的精兵強將野心勃勃。

每日經濟新聞