圖片系AI生成
什麽加速了雲的發展?
自2006年雲端運算誕生之日算起,互聯網和流動應用、雲原生技術普及、企業向先進技術架構演進、中企全球化等因素,先後塑造了雲端運算的內在與外表,造就了一個數萬億規模的行業。
毋庸置疑的是,生成式AI將是雲端運算產業下一個革命性要素,但是,雲廠商如何做大模型,行業內還沒有達成一致。
開源與閉源,自研與投資,基礎模型與工程化落地,技術創新與產業生態,阿裏雲沒有做選擇題,而是兼收並蓄,去構建一個AI與雲的商業迴圈。
5月9日,阿裏雲正式釋出通義千問2.5,中文效能全面趕超GPT-4 Turbo,同時通義千問1100億參數開源模型在多個基準測評收獲最佳成績,超越Llama-3-70B,成為開源領域最強大模型。此外阿裏雲還升級了百煉平台,更便於支持大型企業和成熟開發者的需求。
通義千問2.5,地表最強中文大模型
基礎模型是生成式AI產業的起點,模型本身在快速發展,從單一語言模型,到能處理文件、音影片、程式碼等各方面的能力,每個維度能力的寬度和深度都在快速地增加,在未來一段時間仍將繼續叠代。
對於大模型廠商來說,本身的基礎模型能力至少要保持在第一梯隊,才有海量的使用者基礎和可持續的吸重力。相比通義千問2.1版本,通義千問2.5的理解能力、邏輯推理、指令遵循、程式碼能力分別提升9%、16%、19%、10%,中文能力表現更為突出,在權威基準OpenCompass上,通義千問2.5得分追平GPT-4 Turbo。
和部份廠商不同的是,阿裏雲開源和閉源兩條路並重,在開源方面走的是「全模態、全尺寸」路線。「阿裏雲的策略不是簡簡單單的開源,我們是要做開源最強的模型」,阿裏雲CTO周靖人表示。
最新款開源的1100億參數模型Qwen1.5-110B,在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型;在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B沖上榜首。
通義也不斷豐富多模態模型和專有能力模型,例如通義千問視覺理解模型Qwen-VL-Max在多個多模態標準測試中超越Gemini Ultra和GPT-4V,通義千問程式碼大模型CodeQwen1.5-7B是HuggingFace程式碼模型榜單Big Code的頭名,也是助手通義靈碼的底座。
周靖人提到,「我們是全球唯一一家積極做最先進的AI模型,同時也敢於全方位開源的雲端運算廠商,因為我們認識到,今天只有把AI能力真正賦能給企業,才能推動整個企業產業的快速發展。」
百煉2.0,開發性與自由度
大模型套用落地的過程中,需要試驗各種各樣的模型,並且企業希望以高性價比的方式融合在自己的業務開發裏,業務場景復雜、自身數據敏感,企業如何安全高效地將大模型和業務有機結合,這是工程化落地的重要課題。
阿裏雲百煉的一大特點,在於最大程度的開放性和自由度。當下一些大模型套用平台采用封閉鏈路,不支持替換原子能力,導致企業開發套用時無法引入自研外掛程式,和業務場景充分融合。
圖片系AI生成
百煉2.0平台從模型開發、套用開發到算力底座全面升級。「當下企業套用大模型存在三種範式:一是對大模型開箱即用,二是對大模型進行微調和持續訓練,三是基於模型開發套用,其中最典型的需求是RAG,以企業數據對大模型進行知識增強。圍繞這些需求,百煉打造了模型中心和套用中心,提供最豐富的模型和最易用的工具箱。」周靖人說。
對希望直接呼叫模型進行推理的企業,百煉整合了上百款大模型API,除了通義、Llama、ChatGLM等系列,還首家托管百川等系列三方模型,值得一提的是,這可能是阿裏大手筆投資大模型創業廠商帶來的優勢。
對需進一步訓練模型的使用者,百煉提供從數據管理、模型調優、評測到部署的全鏈路模型服務,使用者可彈性按需呼叫算力,無需關心底層架構。訓練過程視覺化,還可自動評測模型質素,並與其他模型對比。
對希望打造RAG套用的企業,百煉支持Assistant API開發模式,可在百煉上輕松建立知識庫,並一鍵開啟知識檢索增強(RAG),透過Assistant API聯合輸出。同時,百煉支持agent智能體開發,並能實作多智能體協作、對話記憶等高級功能。
大模型生態亟需建設
相比於海外市場,國內對大模型生態建設的需求更高。據外媒訊息,美國初步計劃對最先進的專有 AI 模型實施出口管制,諸如此類風險,要靠系統生態協作來緩解單點難題。
開源模型和百煉平台也是是生態建設一部份,開源模型能夠讓更多的開發者使用,並於其上搭建更復雜的套用,甚至更復雜的Agent,更好地服務企業,從而推動AI產業的發展。百煉平台能夠連結模型能力和業務場景,幫助大模型在各行各業落地。
阿裏雲不僅在做通義模型的開源,同時也在積極推廣AI社區的發展,魔搭社區總使用者數超過500萬,成為了中國最大的AI模型社區,社區內有大量的AI模型,以及各種數據和經驗,為大模型落地提供指引。
「一門技術的良好發展一定要有一個好的生態,這也是為什麽阿裏雲積極參與生態建設,從魔搭社區到開源體系,更多反饋才能實作更多的業務創新,激發更多模型的套用。」周靖人說。
阿裏雲在大模型領域正在構建大迴圈,以基礎模型為起點,開放生態聚合使用者和行業,更多人使用通義模型,也就能進一步最佳化模型效果,並且帶動阿裏雲服務的采用,最終阿裏雲想實作的是——AI即雲端運算。 (本文正選於鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達)