當前位置: 華文世界 > 科技

全面趕超GPT-4?阿裏雲釋出通義千問2.5

2024-05-09科技
5月9日,阿裏雲正式釋出通義千問2.5。阿裏雲方面表示,該模型效能全面趕超GPT-4Turbo。
阿裏雲表示,與通義千問2.1版本相比,通義千問2.5的理解能力、邏輯推理、指令遵循、程式碼能力分別提升9%、16%、19%、10%;與GPT-4相比,中文語境下,通義千問2.5文本理解、文本生成、知識問答及生活建議、閑聊及對話、安全風險等多項能力趕超GPT-4。隨著通義千問2.5的釋出,阿裏雲表示,在權威基準OpenCompass上,通義千問2.5得分追平GPT-4Turbo,是國產大模型首次在該基準取得該項成績。
「對標」GPT-4正在成為國產大模型的潮流。今年4月,商湯科技宣布釋出全新升級的日日新SenseNova5.0大模型——采用MOE混合專家架構,基於超過10TB tokens訓練,推理上下文視窗200K,商湯科技董事長兼執行長徐立表示日日新5.0大模型體系綜合能力全面對標GPT-4,知識、數學、推理和程式碼能力方面大幅提升。
加速技術追趕的同時,國產大模型也在不斷推進行業落地。阿裏雲公布的數據顯示,目前,通義大模型已透過阿裏雲服務企業超9萬、透過釘釘服務企業超過220萬,通義開源模型累計下載量突破700萬。通義落地套用行程加速,現已進入PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。
此外,阿裏雲還在今日釋出了最新款開源模型1100億參數的Qwen1.5-110B,阿裏雲表示,該模型在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型;HuggingFace推出的開源大模型排行榜OpenLLMLeaderboard上,Qwen1.5-110B位列榜首。阿裏雲表示,海內外大量中小企業和開發者以下載開源模型的方式使用通義,在HuggingFace、魔搭ModelScope等開源社群,通義開源大模型的累計下載量超過了700萬。
同時,阿裏雲通義靈碼也正式宣布推出企業版。通義靈碼是阿裏雲推出的一款智慧編碼助手,基於SOTA水準的通義千問程式碼模型CodeQwen1.5研發,阿裏雲表示,2023年10月釋出至今,通義靈碼的外掛程式下載量已超350萬,每日推薦程式碼超3000萬次,被開發者采納的程式碼超億行。隨著企業版的推出,通義靈碼將滿足企業使用者的客製化需求。
5月9日上午,通義千問2.5釋出後,阿裏巴巴港股盤中略有上漲,截至發稿,阿裏巴巴港股報價76.65港元,今日開盤價為75.75港元。
(本文來自第一財經)