當前位置: 華文世界 > 科技

最高算效智算中心上線,天府智算對AI產業有何啟示?

2024-07-21科技

最高算效智算中心上線,天府智算對AI產業有何啟示?

四川簡陽地處川中,扼巴峽要沖,自古為成渝、川渝及鄂州交通要沖,素有"天府雄州"之稱。

"天府雄州"獨特的區位優勢,在進入數碼經濟時代後,再一次顯示出它的巨大戰略價值。簡陽市將成為成都地區「天府數據中心」的主基地,對於支撐四川數碼經濟、促進成都人工智能產業的快速發展,具有十分重要的意義。

近日,位於四川省簡陽市的「天府電腦西南中心」正式啟用,標誌著「天府」成渝區域計算中心的階段性建設已全部完工。同時,它也將成為國內規模最大的計算中心,不僅代表著未來計算中心的建設方向,更將推動人工智能產業向更高水平的方向發展。

算力效率比是人工智能產業高質素發展的基礎。

四川被譽為"天府之國",擁有完整的工業體系和豐富的教育資源。到2023年,四川的經濟總量將位居全國第5。四川已經從過去的為經濟要量變到質的並重,確立了發展新的高質素生產力和高質素經濟發展的核心理念,那就是要把人工智能產業做優做強,用人工智能等數碼技術為傳統產業提供全方位、深層的賦能。

成都市近幾年聚集了一批人工智能企業、科研院所和創新平台,已經形成了一個完整的產業鏈,從基礎層到技術層,再到套用層,成都市已經形成了一個完整的產業鏈。【成都市人工智能產業高質素發展三年行動計劃(2024-2026年)】明確提出,到2026年,成都人工智能核心產業規模將突破1,500億元,帶動相關產業規模突破1萬億元,成為中國人工智能產業發展高地。

可以預見,伴隨著四川經濟向高質素發展的轉變,以及人工智能產業的不斷發展,對算力的持續需求將會越來越大,而高質素的人工智能計算能力是不會短缺的。能投天府雲總經理任國斌直言,相對於四川地區的經濟規模以及人工智能產業發展的需要,數據中心等算力基礎設施建設還處於追趕與追趕的階段,目前正處於快速發展階段。

任國斌,天府雲常務董事和總經理

在這種情況下,建設高層次的智能計算中心是一種重要趨勢。除智能計算中心規模外,為平衡未來算力供需矛盾,計算效率問題日益突出。事實上,「天府計算西南中心」的啟用,無疑是「成渝計算中心」向「高端計算中心」邁進的一次成功實踐。

眾所周知,生成型人工智能套用的爆發與普及是人工智能產業高質素發展的基礎。另一方面,生成型人工智能需要建立在海量自然語言或者多模態數據之上,對大規模人工智能模型進行持續訓練,通常需要幾千甚至上萬個集群來支持,其計算效率遠超現有套用。

因此,大規模人工智能集群的計算效率直接關系到模型的訓練時間、成本甚至效果,並潛移默化地影響著人工智能的創新與發展。天府西南計算中心無疑對改善 MFU的發展起到了至關重要的作用。

據了解,為了進一步完善 MFU,天府智慧計算西南中心與浪潮資訊人工智能團隊緊密合作,在集群體系結構、高速互聯、計算能力編程等方面進行全面最佳化;在借鑒浪潮資訊大資料來源模型經驗的基礎上,對大資料來源模型模型結構及超參數進行針對性最佳化;借鑒浪潮資訊大資料來源模型訓練與最佳化經驗,有針對性地最佳化分布式訓練策略,實作模型結構與超參量的精準調整,實作張量並列、流式並列與數據並列。透過對張量並列、連續流並列與數據並列的合理設計,對模型結構與超參數進行精準調整,最終實作千億參數規模大規模人工智能模型的算術訓練效率(MFU)提升至80%,創造業界大規模人工智能模型算術訓練效率新紀錄。

天府計算西南計算中心除在 MFU上取得優異成績外,更在數據中心能源效率上做出了大膽創新與突破,以天府計算42 kW風冷計算倉作為創新切入點,完美地解決了高密度數據中心部署、高效散熱、機房維修改造等問題。

風冷電腦智能計算:順應高密度趨勢

高密度化將是未來 IQC發展的一個重要方向。

隨著人工智能產業的迅猛發展,數據中心在計算能力、散熱能力、執行維護以及建設方式等方面均有不同程度的變化。高密度對數據中心的影響主要體現在兩個方面:第一,大規模部署高密度機櫃,實作單位面積內的運算能力;二是將直接促進數據中心能效提升和先進節能技術的發展,以滿足數據中心的綠色低碳需求。

以四川為例,大量人工智能伺服器部署於智能計算中心,造成單個機櫃功耗及能耗上升,數據中心高密度部署面臨高效散熱問題。二是四川省釋出數據中心能效政策,要求集群啟動區新建數據中心能效控制在1.25以下,傳統節能技術已不能滿足需求。三是建設模式、機房環境等方面要滿足 IQC及未來算力業務建設的需要。第三,數據中心的建設方式、機房環境等都要與未來算力服務的建設要求相匹配。

為此,國投天府雲聯合浪潮資訊開展聯合創新,成功研發出42 kW風冷智能計算倉,並在西南地區的天府智能計算中心實作了大規模套用。浪潮資訊伺服器產品線總經理趙帥表示,「42 kW智能制冷計算倉本質上就是一座高密度、模組化的數據中心」,這也是我們目前所面臨的主要問題。

42 kW智能冷卻智能計算倉,以人工智能運算能力為核心,是面向人工智能伺服器的新一代智能計算架構,支持高密度算力部署,整合計算/儲存/網絡,高效整合機櫃,配電, UPS,空調,監控,消防等系統。它以標準化、去工程化、最佳化營運效率、智能化管理為原則,其主要優點有:快速交貨-省時-高密度部署-省地-節能-安全-省心-省心。它以標準化、去工程化、最佳化運作效率、智能化管理為原則,主要優點有:快速交貨-省時-密集部署-省地-節能-節能-安全-省心-省心。

當前,以西南智能計算中心(天府)為代表的智能計算中心正面臨著快速響應人工智能產業發展的迫切需求。使用 Smart Computing的42 KW風冷計算庫,數據中心只需要預定場地、制冷量和電量,就可以在一個星期內完成安裝。

高密度風冷型42千瓦智能計算倉實作後,單機櫃功率密度由3-7千瓦提高到42千瓦,產生超高密度運算能力,實作單位面積計算能力突破,建築用地減少60%。

重要的是,42 kW風冷智能計算倉采用風冷風冷方式實作高能效,整合中壓到末級饋線全功率單路供電及高效率不間斷電源系統,可有效降低30%的能耗。本專案擬采用全封閉的冷熱通道+空調列間水迴圈模式,使制冷效率提升10%以上,能效顯著降低,較傳統風冷數據中心整體節能25%以上。百分之二十五以上。

另外,42千瓦智能計算空調算倉還將人工智能的能力進行了充分的整合,透過人工智能管理平台對數據中心進行統一管理,並結合智能人工智能調優演算法,在數據中心層和伺服器層都能實作雙向故障預警,真正將監測、管理、運維與人工智能有機地結合在一起,安全可靠性提高30%。

"當前,僅靠智能計算中心中的人工智能伺服器已不能滿足需求,必須以更高層次的數據中心來全面支撐人工智能伺服器的部署與套用。趙帥補充道:「浪潮資訊與能源投天府雲在西南算力中心對業務需求進行了充分的分析,一期采用42 kW風冷算力儲存方案,現已投入使用,以滿足當前人工智能產業對算力的需求。」

A. 建立"智能資訊科技中心"的模式

根據 IDC釋出的【全球人工智能支出指南報告】,中國對人工智能的投資預計將在2027年達到381億元人民幣。隨著國家政策及產業轉型升級政策的推動,未來5年,智能計算中心等先進基礎設施將成為市場投資的重點。

隨著中國經濟向高質素、新生產力的快速發展,建設高層次的計算中心已成為全社會乃至整個產業共同的目標。從規劃、設計到上線營運,天府智庫西南智算中心無疑將成為未來智能計算中心建設的典範。

首先,「天府計算西南算力中心」以超前規劃、貼近實際需求的方式,從超前規劃到快速投入使用,保障了成都市人工智能產業的高質素發展,實作了規劃與需求的高度匹配。目前,「天府」西南算力中心已經為各大高校和科技企業提供了大量的算力,在大數據,深度學習,智能語音語意,生物醫學等方面有著廣闊的套用前景。

其次,成都西南智能計算中心是一個典型的行業協同創新案例。智能計算中心是人工智能時代對數據中心進行重新定義的產物,它涉及到計算能力、環境和構建模式等多個方面。浪潮資訊與能源投資「天府雲」緊密合作,創新研發出42 kW智能制冷計算倉解決方案,使大規模人工智能模型訓練效率提高到80%以上。

三是未來有望外銷,使行業受益.面向未來人工智能產業高質素發展的重大需求,智能計算42 kW風冷算力倉解決方案,不僅可以推動天府智庫西南算力中心建設,而且有望為其他智慧計算中心建設提供最優借鑒方案,具有重要的產業價值。

"隨著天府智算42 kW風冷計算倉的交付,我們將在數據中心客製服務方面取得重大突破,有力推動了四川人工智能產業的發展。"趙帥最後說道。