當前位置: 華文世界 > 科技

寧暢AI算力棧火力全開,用全域智算鑿出通往AGI的快車道

2024-04-03科技

智東西
作者 | 三北
編輯 | 漠影

「AI+」時代,大模型正如雨後春筍般湧現,以重構千行百業之勢向通用人工智慧(AGI)全速沖鋒。

「每隔一天在中國就有一個AI大模型出現,我們開玩笑說‘實作了大模型的日拋’。」寧暢CEO秦曉寧在3月29日北京舉辦的寧暢「全域智算」戰略釋出會上說。

▲寧暢CEO秦曉寧

AI大模型日新月異,客戶湧現出對於AI支撐能力體系愈發復雜的需求。不管是萬卡時代的算效「彩票」還是深入行業的精度「盲盒」,以及高效呼叫的服務「瓶頸」,算力產業如何解決這些問題,如何滿足大模型客戶不同的復雜需求,如何建立起一套全面的AI支撐能力體系,都是當下亟需解決的問題。

基於這樣的背景,在大模型遍地開花之春,寧暢於3月39日釋出了「全域智算」戰略,在業內率先開啟大模型時代智慧算力系統變革的沖鋒。

同時,寧暢還推出包括「AI算力棧」在內的一系列戰略性新品與系統解決方案,以助大模型產業解決大模型產業落地的全周期問題。

一、大模型遍地開花,用全域智算栽培「AI+」碩果

中國大模型已經遍地開花。根據國家數據局最新統計,中國10億參數規模以上的大模型數量已超100個,行業大模型已經在賦能各個領域。

大模型狂歡背後,是大模型行業和企業的需求不斷升級,推動整個AI支撐能力的加速叠代。

深紮AI算力領域多年,秦曉寧在過去近一年裏有了新發現。她觀察到,大模型發展到現在,客戶的需求大致呈現了兩個階段的變化:

第一階段:「百模大戰」時期,流行這樣一句話:不管大模型發展得如何,賣鏟子的供應商肯定不會虧。大模型是科技巨頭之間的參數極限的競賽,算力提供商就像賣鏟子一樣,只需要提供更快更強的硬體產品,不用太關註大模型客戶如何去挖掘「金礦」,

第二階段:也就是進入2024年以來,隨著外部環境變化,大模型從參數競賽走向了商業化、產業化的落地階段。供應商不僅要提供算力硬體,更多的是整個支撐能力體系的升級,就像「木桶原理」一樣,各類能力都不能有短板。

秦曉寧認為,客戶需要在算力、演算法、數據三個維度獲得更強的支撐,並在AI的硬體層、集群層、中台層、內容層、服務層都獲得全方位多維度的能力。

為此,寧暢宣布推出「全域智算」戰略,助客戶解決復雜、系統性的大模型落地問題。

全域智算,顧名思義,就是以系統、全面性來對抗需求的復雜性,以全面AI支撐能力覆蓋大模型發展的全生命周期。如下圖所示,全域智算主要包括六大層面。

▲寧暢全域智算能力圖

最底層是硬體資源層,這是被大家最廣泛所熟知的,以傳統的通用伺服器、GPU、整機櫃、儲存、網路等多種形態的硬體產品為主。

第二層是集群設計層,這不是將海量硬體進行簡單的連線堆疊,而是透過分析整個業務執行的特征和系統的量化需求,提供從微架構、網路、儲存到AI模型特征等一系列的方案化設計。

第三層是算子最佳化層,為了降本增效寧暢提供了整體的AI算子最佳化能力,減少模型執行的時間,降低資源消耗,提高能效比,使得AI能夠在有效的資源上高效執行。

第四層是AI中台層,目前寧暢已全面支持NVAIE的中台系統,及自己的中台NEX AIOM,這個系統可以提供基於AI算力系統深度整合的工作棧。

再往上,則是更具體的業務層和場景層,寧暢也提供相應的解決方案及服務。

總的來看,寧暢提出的「全域智算」戰略,試圖透過全體系、全液冷、全服務、全場景、全行業、全階段這「六全」來為大模型提供全周期服務,從而培育出「AI+」產業化的碩果。

▲寧暢全域智算硬體產品「全家福」

二、硬軟服一體化,破解智慧算力落地難題

過去一年,受益於「百模大戰」,中國算力規模加速擴容,為算力落地套用提供了一定基礎。

根據工信部釋出數據,截至2023年10月中國算力規模超300EFLOPS,智慧算力占比高達35%;同時,我們看到千P級智算中心的智算基建布局集中爆發,數億到10億元的GPU伺服器采購及算力租賃訂單比比皆是,眾多算力概念股也被帶飛。

但與此同時,智慧算力的落地套用問題依然嚴峻。如何讓千卡甚至萬卡算力從硬體,轉化為大模型企業的模型效能,甚至是「AI+」行業落地的成功?算力產業還有一段路要走。

對此,寧暢推出了「AI算力棧」,以底層硬體到頂層套用平台的系統化方案,構建全棧AI環境,滿足大模型落地所需的計算、儲存、網路、建設、管理、套用及液冷等需求。

寧暢CTO趙雷介紹,在硬體層上,寧暢「AI算力棧」可實作多種交付形態靈活組合。其中,寧暢B8000液冷整機櫃伺服器作為AI算力棧最具亮點的交付形態,采用電、液、網三路全盲插設計,部署周期相較傳統方式提升30倍。


▲寧暢CTO趙雷

在軟體層上,基於系統工程及演算法模型,寧暢以AI算子全棧最佳化能力,為AI業務提供並列加速、效能分析、模型開發最佳化等服務支持,構建出從算力資源客製,到模型適配最佳化,再到高效部署落地的大模型算力服務閉環,幫助使用者極速推進AI套用開發及管理。

英特爾AI首席架構師吳震華強調:「第四代/第五代英特爾® 至強® 可延伸處理器的卓越效能,將為寧暢AI算力棧帶來更強助力。」

此外,在智算中心建設大潮下,寧暢「AI算力棧」方案以其全面、靈活、深度的支撐能力,可為行業級/企業級智算中心的構建提供強有力的支持,確保智算中心的建設既符合當前業務所需,又具備前瞻性與適應力。

縱觀整個算力產業,我們看到包括「味精大王」在內的不少跨行玩家都湧入了智算產業,但兼具硬、軟、服實力的玩家並不多。

透過寧暢「AI算力棧」,應該可以明確的是,企業和行業為了避免重復建設和浪費,應該選擇沒有能力短板的專業AI算力提供服務商,搭建智慧計算的新高地。

三、寧暢打造王牌AI算力棧,加速千行百業數智化

目前,國內第一個「AI算力棧」——寧暢NEX AI Lab(Nettrix AI Open Lab)已在桐鄉市成功落地並開放預約試用。


▲寧暢NEX AI Lab

這一AI算力棧計畫是一個包括128台GPU伺服器的千卡級別算力集群。該計畫展現了套用場景最佳化、行業智算客製解決方案,透過免費提供軟、硬體服務,帶來大模型、數據科學、推薦系統等解決方案工作流的先進體驗。

同時,它可以給使用者提供免費的算力體驗,大家可以把自己的業務拿到上面執行,嘗試不同的業務組合、不同的網路方案、不同的軟體和框架的調整,以便快速作出購買決策。

趙雷透露,這一AI算力棧最主力伺服器采用X640 G50伺服器,單台具備956T的算力;同時支持20個節點的X680 G55液冷伺服器,有效地驗證了液冷伺服器在高頻寬情況下的使用情況。

在套用方面,這一AI算力棧已正式執行近三周。該算力棧已完成了大量的多元AI場景的實際套用,包括語言模型、OCR、轉譯、智慧推薦等,都順利完成了初步測試。

寧暢自2019年創立以來,根據知名行研機構IDC報告,其在2021年就拿下來中國GPU及加速計算伺服器市場年度銷售額第二的寶座。現在,乘風新一波AI大模型浪潮,寧暢正透過千卡集群級的AI算力棧,布局更大的「全域智算」藍圖,從而助力千行百業的數智化轉型。

結語:智慧計算升級,為大模型產業發展保駕護航

回顧2023年,在「百模大戰」狂潮之中,智慧算力成為一門好生意。以寧暢為代表的算力供應商在厚積薄發的同時,也在大模型市場需求的推動下,探索智慧算力系統的新叠代。

展望2024年,「AI+」時代的大模型產業化落地正在加速,誰在盛名之下其實難副,誰是真槍實劍披掛上陣?寧暢正用「全域智算」戰略及其AI算力棧方案給出一份自信的答卷,為大模型產業發展保駕護航。