騰訊副總裁蔣傑：騰訊混元率先采用MoE結構升級 效能提升超50%

2024-05-06科技

在4月26日—28日舉行的第十七屆中國電子資訊年會上，騰訊公司副總裁蔣傑表示，騰訊專註於自主可控的大模型技術發展路線，聚焦基礎研究，正在利用自身積累和實力構建底層算力網路，開發訓練框架，不斷叠代技術，積極落地新套用，推動人工智慧+及新質生產力發展。

[MD:Title]
騰訊公司副總裁蔣傑

騰訊混元是騰訊基於全鏈路自主可控技術打造的生成式大模型，自2023年9月首次亮相以來，透過持續叠代和實踐，積累了從底層算力到機器學習平台再到上層套用的完整自主技術。目前，騰訊混元大模型參數量已達到萬億，tokens數量超過7萬億。國際權威調研機構沙利文釋出的【2024年中國大模型能力評測】顯示，騰訊混元在通用基礎能力和專業套用能力已居國內第一梯隊。

演算法層面，騰訊混元大模型率先采用混合專家模型 (MoE) 結構，並在這個過程積累大量自研技術，其中包括創新的專家路由Routing演算法、獨創的MoE Scaling Law機制以及合成數據技術，實作模型總體效能相比上一代Dense模型提升50%。

訓練和推理框架上，騰訊自研Angel機器學習平台面向大模型訓練，在預訓練、模型精調、強化學習多個階段進行最佳化，相比業界開源框架，可以用更少的資源訓練更大的模型，訓練速度是主流框架的2.6倍；面向大模型推理，Angel機器學習平台實作成本相比業界主流框架下降70%，支持國產主流硬體的適配。

算力層面，騰訊擁有自研星脈高效能計算網路，使用領先的3層網路架構，可支持單集群12.8萬卡規模，具備業界最高的3.2T通訊頻寬，可提升40%的GPU利用率，節省30%—60%的模型訓練成本，為AI大模型帶來10倍通訊效能提升。此外，星脈網路中的交換機、光模組、網卡均是騰訊全鏈路自研。

會上，中國電子學會正式頒發2023中國電子學會科學技術獎。騰訊聯合北京大學、北京科技大學共同研制的計畫【面向大規模數據的Angel機器學習平台關鍵技術及套用】榮獲科技進步一等獎。由多名院士等權威專家組成的鑒定委員會認為：Angel機器學習平台技術復雜度高、研制難度大、創新性強，套用前景廣闊，整體技術達到國際先進水平。

創新技術的同時，騰訊也在持續探索大模型在各行業場景中的實際套用。目前，騰訊混元大模型已經支持騰訊會議、企業微信、騰訊文件等內部超過400個業務和場景接入，並透過騰訊雲，面向企業和個人開發者全面開放。騰訊旗下協作SaaS產品已經全面接入騰訊混元大模型，騰訊樂享、騰訊電子簽、騰訊問卷、騰訊雲AI程式碼助手等協作SaaS產品也都已實作智慧化升級。

據蔣傑現場介紹，目前騰訊混元大模型也在文生圖、圖片理解和生成、視訊生成等多模態方向進行技術探索，並攜手合作夥伴嘗試落地套用，在傳媒領域，目前，新華社、央視新聞、南方都市報等20多家媒體也深度使用騰訊混元視訊生成、文生圖等進行內容生產和創作提效。

騰訊副總裁蔣傑：騰訊混元率先采用MoE結構升級 效能提升超50%

騰訊副總裁蔣傑：騰訊混元率先采用MoE結構升級效能提升超50%