智東西
作者 | 三北
編輯 | 漠影
「AI+」時代,大模型正如雨後春筍般湧現,以重構千行百業之勢向通用人工智能(AGI)全速沖鋒。
「每隔一天在中國就有一個AI大模型出現,我們開玩笑說‘實作了大模型的日拋’。」寧暢CEO秦曉寧在3月29日北京舉辦的寧暢「全域智算」戰略釋出會上說。
▲寧暢CEO秦曉寧
AI大模型日新月異,客戶湧現出對於AI支撐能力體系愈發復雜的需求。不管是萬卡時代的算效「彩票」還是深入行業的精度「盲盒」,以及高效呼叫的服務「瓶頸」,算力產業如何解決這些問題,如何滿足大模型客戶不同的復雜需求,如何建立起一套全面的AI支撐能力體系,都是當下亟需解決的問題。
基於這樣的背景,在大模型遍地開花之春,寧暢於3月39日釋出了「全域智算」戰略,在業內率先開啟大模型時代智能算力系統變革的沖鋒。
同時,寧暢還推出包括「AI算力棧」在內的一系列戰略性新品與系統解決方案,以助大模型產業解決大模型產業落地的全周期問題。
一、大模型遍地開花,用全域智算栽培「AI+」碩果
中國大模型已經遍地開花。根據國家數據局最新統計,中國10億參數規模以上的大模型數量已超100個,行業大模型已經在賦能各個領域。
大模型狂歡背後,是大模型行業和企業的需求不斷升級,推動整個AI支撐能力的加速叠代。
深紮AI算力領域多年,秦曉寧在過去近一年裏有了新發現。她觀察到,大模型發展到現在,客戶的需求大致呈現了兩個階段的變化:
第一階段:「百模大戰」時期,流行這樣一句話:不管大模型發展得如何,賣鏟子的供應商肯定不會虧。大模型是科技巨頭之間的參數極限的競賽,算力提供商就像賣鏟子一樣,只需要提供更快更強的硬件產品,不用太關註大模型客戶如何去挖掘「金礦」,
第二階段:也就是進入2024年以來,隨著外部環境變化,大模型從參數競賽走向了商業化、產業化的落地階段。供應商不僅要提供算力硬件,更多的是整個支撐能力體系的升級,就像「木桶原理」一樣,各類能力都不能有短板。
秦曉寧認為,客戶需要在算力、演算法、數據三個維度獲得更強的支撐,並在AI的硬件層、集群層、中台層、內容層、服務層都獲得全方位多維度的能力。
為此,寧暢宣布推出「全域智算」戰略,助客戶解決復雜、系統性的大模型落地問題。
全域智算,顧名思義,就是以系統、全面性來對抗需求的復雜性,以全面AI支撐能力覆蓋大模型發展的全生命周期。如下圖所示,全域智算主要包括六大層面。
▲寧暢全域智算能力圖
最底層是硬件資源層,這是被大家最廣泛所熟知的,以傳統的通用伺服器、GPU、整機櫃、儲存、網絡等多種形態的硬件產品為主。
第二層是集群設計層,這不是將海量硬件進行簡單的連線堆疊,而是透過分析整個業務執行的特征和系統的量化需求,提供從微架構、網絡、儲存到AI模型特征等一系列的方案化設計。
第三層是算子最佳化層,為了降本增效寧暢提供了整體的AI算子最佳化能力,減少模型執行的時間,降低資源消耗,提高能效比,使得AI能夠在有效的資源上高效執行。
第四層是AI中台層,目前寧暢已全面支持NVAIE的中台系統,及自己的中台NEX AIOM,這個系統可以提供基於AI算力系統深度整合的工作棧。
再往上,則是更具體的業務層和場景層,寧暢也提供相應的解決方案及服務。
總的來看,寧暢提出的「全域智算」戰略,試圖透過全體系、全液冷、全服務、全場景、全行業、全階段這「六全」來為大模型提供全周期服務,從而培育出「AI+」產業化的碩果。
▲寧暢全域智算硬件產品「全家福」
二、硬軟服一體化,破解智能算力落地難題
過去一年,受益於「百模大戰」,中國算力規模加速擴容,為算力落地套用提供了一定基礎。
根據工信部釋出數據,截至2023年10月中國算力規模超300EFLOPS,智能算力占比高達35%;同時,我們看到千P級智算中心的智算基建布局集中爆發,數億到10億元的GPU伺服器采購及算力租賃訂單比比皆是,眾多算力概念股也被帶飛。
但與此同時,智能算力的落地套用問題依然嚴峻。如何讓千卡甚至萬卡算力從硬件,轉化為大模型企業的模型效能,甚至是「AI+」行業落地的成功?算力產業還有一段路要走。
對此,寧暢推出了「AI算力棧」,以底層硬件到頂層套用平台的系統化方案,構建全棧AI環境,滿足大模型落地所需的計算、儲存、網絡、建設、管理、套用及液冷等需求。
寧暢CTO趙雷介紹,在硬件層上,寧暢「AI算力棧」可實作多種交付形態靈活組合。其中,寧暢B8000液冷整機櫃伺服器作為AI算力棧最具亮點的交付形態,采用電、液、網三路全盲插設計,部署周期相較傳統方式提升30倍。
▲寧暢CTO趙雷
在軟件層上,基於系統工程及演算法模型,寧暢以AI算子全棧最佳化能力,為AI業務提供並列加速、效能分析、模型開發最佳化等服務支持,構建出從算力資源客製,到模型適配最佳化,再到高效部署落地的大模型算力服務閉環,幫助使用者極速推進AI套用開發及管理。
英特爾AI首席架構師吳震華強調:「第四代/第五代英特爾® 至強® 可延伸處理器的卓越效能,將為寧暢AI算力棧帶來更強助力。」
此外,在智算中心建設大潮下,寧暢「AI算力棧」方案以其全面、靈活、深度的支撐能力,可為行業級/企業級智算中心的構建提供強有力的支持,確保智算中心的建設既符合當前業務所需,又具備前瞻性與適應力。
縱觀整個算力產業,我們看到包括「味精大王」在內的不少跨行玩家都湧入了智算產業,但兼具硬、軟、服實力的玩家並不多。
透過寧暢「AI算力棧」,應該可以明確的是,企業和行業為了避免重復建設和浪費,應該選擇沒有能力短板的專業AI算力提供服務商,搭建智能計算的新高地。
三、寧暢打造王牌AI算力棧,加速千行百業數智化
目前,國內首個「AI算力棧」——寧暢NEX AI Lab(Nettrix AI Open Lab)已在桐鄉市成功落地並開放預約試用。
▲寧暢NEX AI Lab
這一AI算力棧專案是一個包括128台GPU伺服器的千卡級別算力集群。該專案展現了套用場景最佳化、行業智算客製解決方案,透過免費提供軟、硬件服務,帶來大模型、數據科學、推薦系統等解決方案工作流的先進體驗。
同時,它可以給使用者提供免費的算力體驗,大家可以把自己的業務拿到上面執行,嘗試不同的業務組合、不同的網絡方案、不同的軟件和框架的調整,以便快速作出購買決策。
趙雷透露,這一AI算力棧最主力伺服器采用X640 G50伺服器,單台具備956T的算力;同時支持20個節點的X680 G55液冷伺服器,有效地驗證了液冷伺服器在高頻寬情況下的使用情況。
在套用方面,這一AI算力棧已正式執行近三周。該算力棧已完成了大量的多元AI場景的實際套用,包括語言模型、OCR、轉譯、智能推薦等,都順利完成了初步測試。
寧暢自2019年創立以來,根據知名行研機構IDC報告,其在2021年就拿下來中國GPU及加速計算伺服器市場年度銷售額第二的寶座。現在,乘風新一波AI大模型浪潮,寧暢正透過千卡集群級的AI算力棧,布局更大的「全域智算」藍圖,從而助力千行百業的數智化轉型。
結語:智能計算升級,為大模型產業發展保駕護航
回顧2023年,在「百模大戰」狂潮之中,智能算力成為一門好生意。以寧暢為代表的算力供應商在厚積薄發的同時,也在大模型市場需求的推動下,探索智能算力系統的新叠代。
展望2024年,「AI+」時代的大模型產業化落地正在加速,誰在盛名之下其實難副,誰是真槍實劍披掛上陣?寧暢正用「全域智算」戰略及其AI算力棧方案給出一份自信的答卷,為大模型產業發展保駕護航。