當前位置: 華文世界 > 科技

大模型,阿裏雲不做選擇題

2024-05-12科技

圖片系AI生成

什麽加速了雲的發展?

自2006年雲端運算誕生之日算起,互聯網和行動應用、雲原生技術普及、企業向先進技術架構演進、中企全球化等因素,先後塑造了雲端運算的內在與外表,造就了一個數萬億規模的行業。

毋庸置疑的是,生成式AI將是雲端運算產業下一個革命性要素,但是,雲廠商如何做大模型,行業內還沒有達成一致。

開源與閉源,自研與投資,基礎模型與工程化落地,技術創新與產業生態,阿裏雲沒有做選擇題,而是兼收並蓄,去構建一個AI與雲的商業迴圈。

5月9日,阿裏雲正式釋出通義千問2.5,中文效能全面趕超GPT-4 Turbo,同時通義千問1100億參數開源模型在多個基準測評收獲最佳成績,超越Llama-3-70B,成為開源領域最強大模型。此外阿裏雲還升級了百煉平台,更便於支持大型企業和成熟開發者的需求。

通義千問2.5,地表最強中文大模型

基礎模型是生成式AI產業的起點,模型本身在快速發展,從單一語言模型,到能處理文件、音視訊、程式碼等各方面的能力,每個維度能力的寬度和深度都在快速地增加,在未來一段時間仍將繼續叠代。

對於大模型廠商來說,本身的基礎模型能力至少要保持在第一梯隊,才有海量的使用者基礎和永續的吸重力。相比通義千問2.1版本,通義千問2.5的理解能力、邏輯推理、指令遵循、程式碼能力分別提升9%、16%、19%、10%,中文能力表現更為突出,在權威基準OpenCompass上,通義千問2.5得分追平GPT-4 Turbo。

和部份廠商不同的是,阿裏雲開源和閉源兩條路並重,在開源方面走的是「全模態、全尺寸」路線。「阿裏雲的策略不是簡簡單單的開源,我們是要做開源最強的模型」,阿裏雲CTO周靖人表示。

最新款開源的1100億參數模型Qwen1.5-110B,在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型;在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B沖上榜首。

通義也不斷豐富多模態模型和專有能力模型,例如通義千問視覺理解模型Qwen-VL-Max在多個多模態標準測試中超越Gemini Ultra和GPT-4V,通義千問程式碼大模型CodeQwen1.5-7B是HuggingFace程式碼模型榜單Big Code的頭名,也是助手通義靈碼的底座。

周靖人提到,「我們是全球唯一一家積極做最先進的AI模型,同時也敢於全方位開源的雲端運算廠商,因為我們認識到,今天只有把AI能力真正賦能給企業,才能推動整個企業產業的快速發展。」

百煉2.0,開發性與自由度

大模型套用落地的過程中,需要試驗各種各樣的模型,並且企業希望以高價效比的方式融合在自己的業務開發裏,業務場景復雜、自身數據敏感,企業如何安全高效地將大模型和業務有機結合,這是工程化落地的重要課題。

阿裏雲百煉的一大特點,在於最大程度的開放性和自由度。當下一些大模型套用平台采用封閉鏈路,不支持替換原子能力,導致企業開發套用時無法引入自研外掛程式,和業務場景充分融合。

圖片系AI生成

百煉2.0平台從模型開發、套用開發到算力底座全面升級。「當下企業套用大模型存在三種範式:一是對大模型開箱即用,二是對大模型進行微調和持續訓練,三是基於模型開發套用,其中最典型的需求是RAG,以企業數據對大模型進行知識增強。圍繞這些需求,百煉打造了模型中心和套用中心,提供最豐富的模型和最易用的工具箱。」周靖人說。

對希望直接呼叫模型進行推理的企業,百煉整合了上百款大模型API,除了通義、Llama、ChatGLM等系列,還首家托管百川等系列三方模型,值得一提的是,這可能是阿裏大手筆投資大模型創業廠商帶來的優勢。

對需進一步訓練模型的使用者,百煉提供從數據管理、模型調優、評測到部署的全鏈路模型服務,使用者可彈性按需呼叫算力,無需關心底層架構。訓練過程視覺化,還可自動評測模型品質,並與其他模型對比。

對希望打造RAG套用的企業,百煉支持Assistant API開發模式,可在百煉上輕松建立知識庫,並一鍵開啟知識檢索增強(RAG),透過Assistant API聯合輸出。同時,百煉支持agent智慧體開發,並能實作多智慧體協作、對話記憶等高級功能。

大模型生態亟需建設

相比於海外市場,國內對大模型生態建設的需求更高。據外媒訊息,美國初步計劃對最先進的專有 AI 模型實施出口管制,諸如此類風險,要靠系統生態協作來緩解單點難題。

開源模型和百煉平台也是是生態建設一部份,開源模型能夠讓更多的開發者使用,並於其上搭建更復雜的套用,甚至更復雜的Agent,更好地服務企業,從而推動AI產業的發展。百煉平台能夠連結模型能力和業務場景,幫助大模型在各行各業落地。

阿裏雲不僅在做通義模型的開源,同時也在積極推廣AI社群的發展,魔搭社群總使用者數超過500萬,成為了中國最大的AI模型社群,社群內有大量的AI模型,以及各種數據和經驗,為大模型落地提供指引。

「一門技術的良好發展一定要有一個好的生態,這也是為什麽阿裏雲積極參與生態建設,從魔搭社群到開源體系,更多反饋才能實作更多的業務創新,激發更多模型的套用。」周靖人說。

阿裏雲在大模型領域正在構建大迴圈,以基礎模型為起點,開放生態聚合使用者和行業,更多人使用通義模型,也就能進一步最佳化模型效果,並且帶動阿裏雲服務的采用,最終阿裏雲想實作的是——AI即雲端運算。 (本文先發於鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達)