全面趕超GPT-4？阿裏雲釋出通義千問2.5

2024-05-09科技

5月9日，阿裏雲正式釋出通義千問2.5。阿裏雲方面表示，該模型效能全面趕超GPT-4Turbo。

阿裏雲表示，與通義千問2.1版本相比，通義千問2.5的理解能力、邏輯推理、指令遵循、程式碼能力分別提升9%、16%、19%、10%；與GPT-4相比，中文語境下，通義千問2.5文本理解、文本生成、知識問答及生活建議、閑聊及對話、安全風險等多項能力趕超GPT-4。隨著通義千問2.5的釋出，阿裏雲表示，在權威基準OpenCompass上，通義千問2.5得分追平GPT-4Turbo，是國產大模型首次在該基準取得該項成績。

「對標」GPT-4正在成為國產大模型的潮流。今年4月，商湯科技宣布釋出全新升級的日日新SenseNova5.0大模型——采用MOE混合專家架構，基於超過10TB tokens訓練，推理上下文視窗200K，商湯科技董事長兼執行長徐立表示日日新5.0大模型體系綜合能力全面對標GPT-4，知識、數學、推理和程式碼能力方面大幅提升。

加速技術追趕的同時，國產大模型也在不斷推進行業落地。阿裏雲公布的數據顯示，目前，通義大模型已透過阿裏雲服務企業超9萬、透過釘釘服務企業超過220萬，通義開源模型累計下載量突破700萬。通義落地套用行程加速，現已進入PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。

此外，阿裏雲還在今日釋出了最新款開源模型1100億參數的Qwen1.5-110B，阿裏雲表示，該模型在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型；HuggingFace推出的開源大模型排行榜OpenLLMLeaderboard上，Qwen1.5-110B位列榜首。阿裏雲表示，海內外大量中小企業和開發者以下載開源模型的方式使用通義，在HuggingFace、魔搭ModelScope等開源社群，通義開源大模型的累計下載量超過了700萬。

同時，阿裏雲通義靈碼也正式宣布推出企業版。通義靈碼是阿裏雲推出的一款智慧編碼助手，基於SOTA水準的通義千問程式碼模型CodeQwen1.5研發，阿裏雲表示，2023年10月釋出至今，通義靈碼的外掛程式下載量已超350萬，每日推薦程式碼超3000萬次，被開發者采納的程式碼超億行。隨著企業版的推出，通義靈碼將滿足企業使用者的客製化需求。

5月9日上午，通義千問2.5釋出後，阿裏巴巴港股盤中略有上漲，截至發稿，阿裏巴巴港股報價76.65港元，今日開盤價為75.75港元。

(本文來自第一財經)