當前位置: 華文世界 > 科技

全球最高算效智算中心上線,天府智算對AI產業的深遠啟示!

2024-07-23科技

全球最高算效智算中心上線,天府智算對AI產業的深遠啟示!

四川簡陽位於四川腹地,控巴海峽,為成渝和川鄂的咽喉要道,成渝和川鄂的咽喉要道,自古以來就被譽為"天府雄州"。

"天府雄州"這一特殊的區位優勢,在進入數碼經濟時代後,又一次顯示出了它的重大戰略價值。簡陽市作為成渝地區「天府」區域的核心區域,將對四川「數碼經濟」乃至成都「人工智能」的發展起到積極的促進作用。

日前,簡陽市「天府」電腦西南區域運算中心正式投入使用,而成渝區域電腦二期工程也已完工。同時,它也將是全國規模最大的超算中心,它既代表著未來計算中心的發展趨勢,又將推動人工智能產業的高速發展。

高效率的計算能力才能推動人工智能行業高質素發展

四川是"天府之國",它有著完整的工業體系和豐富的教育資源。到了2023年,四川的 GDP將在全國排名第5。四川從以往的「量」和「質」兩個維度出發,確立了「新質生產力」和「高品質」這一核心思想,就是要把人工智能產業做好,把人工智能等數碼技術充分利用起來,讓傳統產業變得更加強大。

成都市作為一個典型,近幾年來,成都市已經建成了一批人工智能企業、科研院所和創新平台,從基礎層到技術層,從基礎層到套用層,從基礎層到套用層,已經建立起一個完整的產業鏈。【成都市人工智能產業高質素發展三年行動計劃(2024-2026年)】明確提出,成都將在「十四五」期間,以「十四五」為目標,力爭實作「十四五」「五年」,「六個一」、「五個一」,「五個代表」、「六個代表」和「七個代表」。

可以預計,在四川經濟全面轉型、人工智能產業持續發展的背景下,對計算能力的需求將會非常龐大,對人工智能的高品質計算能力是不會短缺的。能投天府雲執行董事兼總經理任國斌也清楚地指出,相對於四川地區的經濟規模以及人工智能產業的發展,目前的計算能力建設還處在一個高速發展的時期,還存在著一些不足。

任國斌,天雲號公司的常務董事

在這種情況下,構建高效能、智能化的計算中心是一種重要的潮流。在解決智能計算中心規模問題的同時,計算效率(MFU)在解決計算資源供求矛盾方面的作用也日益凸顯。而實際上,成渝電腦中心的啟用,也代表著它在高端計算中心上的成功運用。

正如我們所知,如果沒有人工智能的生產性套用的爆發與普及,人工智能行業將會獲得高質素的發展。另一方面,產生型人工智能要求建立在海量自然語言或多模態數據基礎上,對大規模人工智能模型進行連續訓練,通常需要幾千到幾萬個 AI集群,對 AI計算能力的需求也遠遠超過了現有套用。

因此,其訓練計算能力的有效性不僅關系到模型訓練的時間、成本乃至效果,更是影響人工智能生產性研發創新和人工智能產業高質素發展的重要因素。毫無疑問,天府電腦西南中心為提升 MFU所做的貢獻是毋庸置疑的。

據了解,為了使 MFU更好地發揮作用,我們將與浪潮資訊人工智能專案組緊密協作,在集群體系結構、高速互聯、資源排程等方面進行全方位的最佳化;在此基礎上,借鑒浪潮大模型的訓練與最佳化經驗,研究面向張量並列、流並列、數據並列的張量張量。在此基礎上,借鑒浪潮等大模型的訓練與最佳化經驗,有針對性地最佳化分布式學習策略,透過張量並列、流並列性及數據並列性等手段,實作模型結構與超參量的精細調控。本專案擬透過張量並列、流式並列與數據並列化設計,以及在訓練過程中對模型結構與超參量的精細調整,實作千億參量人工智能大模型的訓練效能提升至80%,創造行業內人工智能大模型訓練效能的新高度。

在充分發揮 MFU (數理效能)優勢的同時,天府計算西南中心在能源效率上也做出了大膽的創新與突破,以42 kW風冷箱作為創新的切入點,很好地解決了數據中心的高密度分布、高效散熱以及機房維修改造等問題。

智能計算風冷電腦:順應高密度發展的潮流

高密度是離子交換膜技術今後的發展方向。

隨著人工智能行業的迅猛發展,其計算能力、散熱能力、執行維護能力以及建造方式等方面均有不同程度的變化,使得其高整合度成為必然趨勢。對數據中心來說,高密度化的功能有兩個:第一,大範圍地部署高密度的機櫃,以達到計算單元的計算能力;二是將直接促進數據中心的能效提升和先進節能技術的發展,從而更好地適應數據中心的綠色、低碳需求。

針對四川地區, IQC中部署了數量龐大的 AI伺服器,導致單個機房功耗和能耗大幅提升,而在密集分布的情況下,如何有效地降低系統的散熱效率是一個亟待解決的問題。二是四川省釋出數據中心能效政策,要求集群啟動區內新建數據中心 PUE不得超過1.25,現有的能耗技術已不能適應這一要求。三是在構建方式、電腦系統等方面,要與 IQC及將來計算能力服務的建設要求保持一致。第三,在構建方式、機房等方面,要滿足未來算力業務發展的需要。

因此,華東理工大學的天府雲和浪潮資訊合作,共同開發出42 kW的智能風冷計算庫,並在西南地區的天府智慧計算中心進行了大規模的套用。」浪潮資訊科技有限公司產品經理趙帥說:「42 kW的智能制冷系統,實質上就是一座高度密集、模組化的數據中心。

42 kW智能制冷能量儲存是面向人工智能伺服器的新型智能計算架構,具有高功耗、整合運算/儲存/網絡、高效整合、機櫃、配電、 UPS、空調、監控、消防等多個方面的功能。本專案以標準化、去工程化、最佳化執行效率、智能管理為原則,具備「快-省時-省地-高密度-省地-節能-節能-安全-省省」的核心優點。它以標準化、去工程化、最佳化運作效率、智能管理為原則,具備「快發貨-省時-高密度配送-省地-節能-節能-安全-便捷」的核心優點。

隨著人工智能行業對計算能力的迫切需要,以「天府智算」為代表的「智慧計算中心」已經成為一種普遍的需求。在42 KW的智能風冷計算庫的基礎上,透過預留場地、制冷量和電量,在一個星期之內就可以安裝完畢,工期減少了70%。

42 kW密集分布的智能風冷機箱,可使單機功率密度由3-7 kW提升至42 kW,形成超密集計算,在單元面積上突破運算能力,降低建築面積60%。

令人贊嘆的是,42 kW的智能風冷蓄能裝置采用風冷式制冷方式,將中壓到終端饋電的全功率簡並源與高效率的 UPS系統相結合,可有效減少30%的電力損失。本專案提出了一種新型的高效制冷方式,即采用全封閉的冷熱通道+排間的高溫進氣方式,將系統的能量效率提升10%,顯著減少能源利用率。百分之二十五以上。

另外,42 kW的智能計算空冷算力庫,透過 AI管理平台,對 AI的所有功能進行了充分的整合,對整個數據中心進行了統一的管理,從而達到了一個真正的 AI監控、管理和維護數據中心的目的。再加上 AI的智能調整演算法,可以在數據中心和伺服器之間進行雙向的失效預警,同時還能提高30%的安全性。

"目前,單靠智能計算中心內的人工智能伺服器已經無法滿足需求,必須建立一個完整的人工智能伺服器來支持人工智能伺服器的部署與套用。趙帥接著說:「浪潮科技和能源投資天府雲在西南計算中心對商業需求進行了充分的分析,使用了42 kW的智算風冷電腦倉解決方案,第一期已經建成,可以滿足目前的人工智能產業對計算能力的要求。」

A. 建立一個「聰明的電腦中心」模型

IDC釋出的【全球人工智能支出指南報告】預計,中國對人工智能的投入將在2027年前達381億美金。隨著國家政策的出台,以及產業轉型升級,包括人工智能在內的高端基礎設施將是今後5年內市場投資的重點。

隨著中國經濟向高品質、新、高質素發展的迫切需要,構建高端計算中心已成為全社會和全行業的共識。從規劃、設計到正式投入使用,智庫西南智腦中心在未來的智慧計算中,都將起到示範作用。

首先,「天府計算西南算力中心」在規劃和需求上達到了極高的匹配度,提前謀劃,貼近需求,提前規劃,及時上線,為成都市人工智能產業的高質素發展提供了有力的保證。目前,「天府計算西南算力中心」主要面向高校科研機構和科技型企業,全方位支持大數據,深度學習,智能語音語意,生物醫學等套用。

其次,在行業協同創新方面,以「天府智庫」為代表的「西南計算所」具有代表性。智能計算中心是人工智能時代對數據中心進行重構的產物。浪潮科技與能源投資「天府雲」緊密合作,自主研發出42 kW智能制冷空調系統,使 AI大數據模型的運算效率提高到80%以上。

三是預期將來外銷,有利於該產業。面向人工智能產業高質素發展的迫切需要,本專案研究成果將為中國西南地區智能計算中心提供重要的技術支撐,並為其它智能計算中心的建設提供借鑒。

"天府智算網西南42 kW智算風冷計算庫的建成,將在客戶化服務方面取得重要突破,有力推動了四川人工智能產業的發展。"趙帥做出了最後的結論。