大模型，阿裏雲不做選擇題

2024-05-12科技

圖片系AI生成

什麽加速了雲的發展？

自2006年雲端運算誕生之日算起，互聯網和行動應用、雲原生技術普及、企業向先進技術架構演進、中企全球化等因素，先後塑造了雲端運算的內在與外表，造就了一個數萬億規模的行業。

毋庸置疑的是，生成式AI將是雲端運算產業下一個革命性要素，但是，雲廠商如何做大模型，行業內還沒有達成一致。

開源與閉源，自研與投資，基礎模型與工程化落地，技術創新與產業生態，阿裏雲沒有做選擇題，而是兼收並蓄，去構建一個AI與雲的商業迴圈。

5月9日，阿裏雲正式釋出通義千問2.5，中文效能全面趕超GPT-4 Turbo，同時通義千問1100億參數開源模型在多個基準測評收獲最佳成績，超越Llama-3-70B，成為開源領域最強大模型。此外阿裏雲還升級了百煉平台，更便於支持大型企業和成熟開發者的需求。

通義千問2.5，地表最強中文大模型

基礎模型是生成式AI產業的起點，模型本身在快速發展，從單一語言模型，到能處理文件、音視訊、程式碼等各方面的能力，每個維度能力的寬度和深度都在快速地增加，在未來一段時間仍將繼續叠代。

對於大模型廠商來說，本身的基礎模型能力至少要保持在第一梯隊，才有海量的使用者基礎和永續的吸重力。相比通義千問2.1版本，通義千問2.5的理解能力、邏輯推理、指令遵循、程式碼能力分別提升9%、16%、19%、10%，中文能力表現更為突出，在權威基準OpenCompass上，通義千問2.5得分追平GPT-4 Turbo。

和部份廠商不同的是，阿裏雲開源和閉源兩條路並重，在開源方面走的是「全模態、全尺寸」路線。「阿裏雲的策略不是簡簡單單的開源，我們是要做開源最強的模型」，阿裏雲CTO周靖人表示。

最新款開源的1100億參數模型Qwen1.5-110B，在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型；在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上，Qwen1.5-110B沖上榜首。

通義也不斷豐富多模態模型和專有能力模型，例如通義千問視覺理解模型Qwen-VL-Max在多個多模態標準測試中超越Gemini Ultra和GPT-4V，通義千問程式碼大模型CodeQwen1.5-7B是HuggingFace程式碼模型榜單Big Code的頭名，也是助手通義靈碼的底座。

周靖人提到，「我們是全球唯一一家積極做最先進的AI模型，同時也敢於全方位開源的雲端運算廠商，因為我們認識到，今天只有把AI能力真正賦能給企業，才能推動整個企業產業的快速發展。」

百煉2.0，開發性與自由度

大模型套用落地的過程中，需要試驗各種各樣的模型，並且企業希望以高價效比的方式融合在自己的業務開發裏，業務場景復雜、自身數據敏感，企業如何安全高效地將大模型和業務有機結合，這是工程化落地的重要課題。

阿裏雲百煉的一大特點，在於最大程度的開放性和自由度。當下一些大模型套用平台采用封閉鏈路，不支持替換原子能力，導致企業開發套用時無法引入自研外掛程式，和業務場景充分融合。

圖片系AI生成

百煉2.0平台從模型開發、套用開發到算力底座全面升級。「當下企業套用大模型存在三種範式：一是對大模型開箱即用，二是對大模型進行微調和持續訓練，三是基於模型開發套用，其中最典型的需求是RAG，以企業數據對大模型進行知識增強。圍繞這些需求，百煉打造了模型中心和套用中心，提供最豐富的模型和最易用的工具箱。」周靖人說。

對希望直接呼叫模型進行推理的企業，百煉整合了上百款大模型API，除了通義、Llama、ChatGLM等系列，還首家托管百川等系列三方模型，值得一提的是，這可能是阿裏大手筆投資大模型創業廠商帶來的優勢。

對需進一步訓練模型的使用者，百煉提供從數據管理、模型調優、評測到部署的全鏈路模型服務，使用者可彈性按需呼叫算力，無需關心底層架構。訓練過程視覺化，還可自動評測模型品質，並與其他模型對比。

對希望打造RAG套用的企業，百煉支持Assistant API開發模式，可在百煉上輕松建立知識庫，並一鍵開啟知識檢索增強（RAG），透過Assistant API聯合輸出。同時，百煉支持agent智慧體開發，並能實作多智慧體協作、對話記憶等高級功能。

大模型生態亟需建設

相比於海外市場，國內對大模型生態建設的需求更高。據外媒訊息，美國初步計劃對最先進的專有 AI 模型實施出口管制，諸如此類風險，要靠系統生態協作來緩解單點難題。

開源模型和百煉平台也是是生態建設一部份，開源模型能夠讓更多的開發者使用，並於其上搭建更復雜的套用，甚至更復雜的Agent，更好地服務企業，從而推動AI產業的發展。百煉平台能夠連結模型能力和業務場景，幫助大模型在各行各業落地。

阿裏雲不僅在做通義模型的開源，同時也在積極推廣AI社群的發展，魔搭社群總使用者數超過500萬，成為了中國最大的AI模型社群，社群內有大量的AI模型，以及各種數據和經驗，為大模型落地提供指引。

「一門技術的良好發展一定要有一個好的生態，這也是為什麽阿裏雲積極參與生態建設，從魔搭社群到開源體系，更多反饋才能實作更多的業務創新，激發更多模型的套用。」周靖人說。

阿裏雲在大模型領域正在構建大迴圈，以基礎模型為起點，開放生態聚合使用者和行業，更多人使用通義模型，也就能進一步最佳化模型效果，並且帶動阿裏雲服務的采用，最終阿裏雲想實作的是——AI即雲端運算。 （本文先發於鈦媒體APP，作者 | 張帥，編輯 | 蓋虹達）