寧暢AI算力棧火力全開，用全域智算鑿出通往AGI的快車道

2024-04-03科技

智東西
作者 | 三北
編輯 | 漠影

「AI+」時代，大模型正如雨後春筍般湧現，以重構千行百業之勢向通用人工智能（AGI）全速沖鋒。

「每隔一天在中國就有一個AI大模型出現，我們開玩笑說‘實作了大模型的日拋’。」寧暢CEO秦曉寧在3月29日北京舉辦的寧暢「全域智算」戰略釋出會上說。

▲寧暢CEO秦曉寧

AI大模型日新月異，客戶湧現出對於AI支撐能力體系愈發復雜的需求。不管是萬卡時代的算效「彩票」還是深入行業的精度「盲盒」，以及高效呼叫的服務「瓶頸」，算力產業如何解決這些問題，如何滿足大模型客戶不同的復雜需求，如何建立起一套全面的AI支撐能力體系，都是當下亟需解決的問題。

基於這樣的背景，在大模型遍地開花之春，寧暢於3月39日釋出了「全域智算」戰略，在業內率先開啟大模型時代智能算力系統變革的沖鋒。

同時，寧暢還推出包括「AI算力棧」在內的一系列戰略性新品與系統解決方案，以助大模型產業解決大模型產業落地的全周期問題。

一、大模型遍地開花，用全域智算栽培「AI+」碩果

中國大模型已經遍地開花。根據國家數據局最新統計，中國10億參數規模以上的大模型數量已超100個，行業大模型已經在賦能各個領域。

大模型狂歡背後，是大模型行業和企業的需求不斷升級，推動整個AI支撐能力的加速叠代。

深紮AI算力領域多年，秦曉寧在過去近一年裏有了新發現。她觀察到，大模型發展到現在，客戶的需求大致呈現了兩個階段的變化：

第一階段：「百模大戰」時期，流行這樣一句話：不管大模型發展得如何，賣鏟子的供應商肯定不會虧。大模型是科技巨頭之間的參數極限的競賽，算力提供商就像賣鏟子一樣，只需要提供更快更強的硬件產品，不用太關註大模型客戶如何去挖掘「金礦」，

第二階段：也就是進入2024年以來，隨著外部環境變化，大模型從參數競賽走向了商業化、產業化的落地階段。供應商不僅要提供算力硬件，更多的是整個支撐能力體系的升級，就像「木桶原理」一樣，各類能力都不能有短板。

秦曉寧認為，客戶需要在算力、演算法、數據三個維度獲得更強的支撐，並在AI的硬件層、集群層、中台層、內容層、服務層都獲得全方位多維度的能力。

為此，寧暢宣布推出「全域智算」戰略，助客戶解決復雜、系統性的大模型落地問題。

全域智算，顧名思義，就是以系統、全面性來對抗需求的復雜性，以全面AI支撐能力覆蓋大模型發展的全生命周期。如下圖所示，全域智算主要包括六大層面。

▲寧暢全域智算能力圖

最底層是硬件資源層，這是被大家最廣泛所熟知的，以傳統的通用伺服器、GPU、整機櫃、儲存、網絡等多種形態的硬件產品為主。

第二層是集群設計層，這不是將海量硬件進行簡單的連線堆疊，而是透過分析整個業務執行的特征和系統的量化需求，提供從微架構、網絡、儲存到AI模型特征等一系列的方案化設計。

第三層是算子最佳化層，為了降本增效寧暢提供了整體的AI算子最佳化能力，減少模型執行的時間，降低資源消耗，提高能效比，使得AI能夠在有效的資源上高效執行。

第四層是AI中台層，目前寧暢已全面支持NVAIE的中台系統，及自己的中台NEX AIOM，這個系統可以提供基於AI算力系統深度整合的工作棧。

再往上，則是更具體的業務層和場景層，寧暢也提供相應的解決方案及服務。

總的來看，寧暢提出的「全域智算」戰略，試圖透過全體系、全液冷、全服務、全場景、全行業、全階段這「六全」來為大模型提供全周期服務，從而培育出「AI+」產業化的碩果。

▲寧暢全域智算硬件產品「全家福」

二、硬軟服一體化，破解智能算力落地難題

過去一年，受益於「百模大戰」，中國算力規模加速擴容，為算力落地套用提供了一定基礎。

根據工信部釋出數據，截至2023年10月中國算力規模超300EFLOPS，智能算力占比高達35%；同時，我們看到千P級智算中心的智算基建布局集中爆發，數億到10億元的GPU伺服器采購及算力租賃訂單比比皆是，眾多算力概念股也被帶飛。

但與此同時，智能算力的落地套用問題依然嚴峻。如何讓千卡甚至萬卡算力從硬件，轉化為大模型企業的模型效能，甚至是「AI+」行業落地的成功？算力產業還有一段路要走。

對此，寧暢推出了「AI算力棧」，以底層硬件到頂層套用平台的系統化方案，構建全棧AI環境，滿足大模型落地所需的計算、儲存、網絡、建設、管理、套用及液冷等需求。

寧暢CTO趙雷介紹，在硬件層上，寧暢「AI算力棧」可實作多種交付形態靈活組合。其中，寧暢B8000液冷整機櫃伺服器作為AI算力棧最具亮點的交付形態，采用電、液、網三路全盲插設計，部署周期相較傳統方式提升30倍。

▲寧暢CTO趙雷

在軟件層上，基於系統工程及演算法模型，寧暢以AI算子全棧最佳化能力，為AI業務提供並列加速、效能分析、模型開發最佳化等服務支持，構建出從算力資源客製，到模型適配最佳化，再到高效部署落地的大模型算力服務閉環，幫助使用者極速推進AI套用開發及管理。

英特爾AI首席架構師吳震華強調：「第四代/第五代英特爾® 至強® 可延伸處理器的卓越效能，將為寧暢AI算力棧帶來更強助力。」

此外，在智算中心建設大潮下，寧暢「AI算力棧」方案以其全面、靈活、深度的支撐能力，可為行業級/企業級智算中心的構建提供強有力的支持，確保智算中心的建設既符合當前業務所需，又具備前瞻性與適應力。

縱觀整個算力產業，我們看到包括「味精大王」在內的不少跨行玩家都湧入了智算產業，但兼具硬、軟、服實力的玩家並不多。

透過寧暢「AI算力棧」，應該可以明確的是，企業和行業為了避免重復建設和浪費，應該選擇沒有能力短板的專業AI算力提供服務商，搭建智能計算的新高地。

三、寧暢打造王牌AI算力棧，加速千行百業數智化

目前，國內首個「AI算力棧」——寧暢NEX AI Lab（Nettrix AI Open Lab）已在桐鄉市成功落地並開放預約試用。

▲寧暢NEX AI Lab

這一AI算力棧專案是一個包括128台GPU伺服器的千卡級別算力集群。該專案展現了套用場景最佳化、行業智算客製解決方案，透過免費提供軟、硬件服務，帶來大模型、數據科學、推薦系統等解決方案工作流的先進體驗。

同時，它可以給使用者提供免費的算力體驗，大家可以把自己的業務拿到上面執行，嘗試不同的業務組合、不同的網絡方案、不同的軟件和框架的調整，以便快速作出購買決策。

趙雷透露，這一AI算力棧最主力伺服器采用X640 G50伺服器，單台具備956T的算力；同時支持20個節點的X680 G55液冷伺服器，有效地驗證了液冷伺服器在高頻寬情況下的使用情況。

在套用方面，這一AI算力棧已正式執行近三周。該算力棧已完成了大量的多元AI場景的實際套用，包括語言模型、OCR、轉譯、智能推薦等，都順利完成了初步測試。

寧暢自2019年創立以來，根據知名行研機構IDC報告，其在2021年就拿下來中國GPU及加速計算伺服器市場年度銷售額第二的寶座。現在，乘風新一波AI大模型浪潮，寧暢正透過千卡集群級的AI算力棧，布局更大的「全域智算」藍圖，從而助力千行百業的數智化轉型。

結語：智能計算升級，為大模型產業發展保駕護航

回顧2023年，在「百模大戰」狂潮之中，智能算力成為一門好生意。以寧暢為代表的算力供應商在厚積薄發的同時，也在大模型市場需求的推動下，探索智能算力系統的新叠代。

展望2024年，「AI+」時代的大模型產業化落地正在加速，誰在盛名之下其實難副，誰是真槍實劍披掛上陣？寧暢正用「全域智算」戰略及其AI算力棧方案給出一份自信的答卷，為大模型產業發展保駕護航。