當前位置: 華文世界 > 科技

萬億中國移動,呼和浩特蓋機房

2024-08-27科技

記者丨何己派 編輯丨鄢子為

從呼和浩特市區驅車20公裏,一路向南,進入和林格爾新區,中國移動智算中心(呼和浩特),坐落於此。

嗡鳴聲中,一排排黑色機櫃整齊列隊,讓算力如同水電,即取即用,沿著縱橫的光纖網絡,流向AI競技場。

歷經7個多月建設,今年6月底,該智算中心的全部集群正式上線。

今年中國移動要全面實作‘東數西算’8大樞紐間的高速互聯 。呼和浩特這一站,開通的是首條400G全光省際骨幹網。」中國移動雲能力中心智算專家李道通向【21CBR】記者表示。

按規劃,該公司將打造萬卡級智算集群標桿,今年還將商用哈爾濱自主可控超萬卡集群,充分滿足大模型集中訓練需求。

AI浪潮下,萬億市值的中國移動,由雲向算,正布一盤大棋。

天然機房

戰略級專案選址呼和浩特,中國移動看上了這裏得天獨厚的資源、地理優勢。

地處北緯40-42度之間,既是大數據產業黃金緯度區,又為京津冀環渤海經濟圈腹地。

當地地質結構穩定,自然災害少,可謂「天上有風光、地下有煤炭、手裏有電網」,發電量位居全國第一,且電價低廉, 數據中心平均用電價格穩定在0.32元/度,為全國最低

「這裏年平均氣溫7.7℃左右,全年低於10度的時間,能占50%以上。」

中國移動呼和浩特數據中心工程師孟繁躍介紹道,「天然環境就能給數據中心自然散熱,用電成本得以大幅降低。」

「天選之地」呼和浩特,已落地建設十個智算中心,集結包括中國移動在內的一批龍頭,於兩個月前,拿下「中國雲谷」的稱號。

孟繁躍表示,團隊做過測算,從呼和浩特到北京,「乘坐」400G全光網絡,最短只需3.5毫秒,「基本與北京當地時間沒有太大差別。」

「煥新」前的中國移動呼和浩特數據中心,肩負東數西算布局中「援京助東」使命。

其既滿足京津冀高即時性算力需求,也能為長三角等區域提供非即時算力,於2012年開工建設,2016年投產營運,多年發展下來,總客戶數上百家。

在做好通算業務的基礎上,順應AI浪潮,該中心布局智算。

智算專案的建設, 總投資46.6億元,部署8個集群 ,建設759個機架,智能算力規模高達6.7EFLOPS(每秒670億億次浮點運算)。

6.7EFLOPS,什麽概念?

與自身對比的話,中國移動呼和浩特數據中心已投產使用9棟機樓,這一單體智算中心的算力規模,比其他8棟樓加起來的算力總和還要多。

系統搭建

「建智算中心,是個復雜的系統工程。」

中國移動呼和浩特數據中心副總經理李程貴提到,相較通算,做智算中心的業務模型估算,難度更大。

他表示,從啟動施工到第一階段的基礎設施具備裝機條件,用了15周時間,較標準工期縮短一半以上。

工期緊張,又涉及工程管理、器材采購等多環節的協同推進,給團隊帶來極大挑戰。

該中心規模化采用新技術,在基礎設施的設計階段,需要做大量協同規劃,亦考驗實施階段的系統穩定性。

例如,在制冷方面, 該中心首次大規模引入冷板式液冷方案 ,配套閉式冷卻塔、小母線等新型節能技術,實作PUE降至1.15。

面對初期建設運維時,GPU卡故障頻發、網絡鏈路不穩、軟件系統缺陷等挑戰,中國移動從三個維度下手。

一是打造一套工具,研發自動化智算中心交付體系,實作標準化流程、自動化部署與高效協同作業,提供開箱即用、效能卓越的穩定執行環境,從而提升部署效率與服務質素。

二是搭建一個大平台,透過算網存軟硬件智能監控處置平台, 對AI訓練任務進行全生命周期管理 ,快速定位問題,確保訓練高效穩定進行。

三是組建專業整合調優團隊,聚焦數據治理等關鍵環節,提供全棧服務。

目前,對內,中國移動智算中心(呼和浩特)支撐集團旗下九天大模型的訓練,對外,滿足行業客戶智算業務需求,例如中石油昆侖大模型的訓練。

算網雄心

今年,三大營運商不約而同地加碼算力網絡建設,尤以中國移動的步子邁得最大。

一個明顯變化是,其資本支出,由5G向算力傾斜——今年用於5G網絡的開支,預計同比減少21%;用於算力的,預計增長21%,達到475億元。

按其規劃, 智能算力的增速,將遠超通算

2024年通用算力將新增3 EFLOPS,達到9 EFLOPS;智能算力將新增7 EFLOPS以上,達到17 EFLOPS。

4月,中國移動公示2024年至2025年新型智算中心采購招標公告,此次采購包含AI伺服器7994台,中標總金額達到約191億元,可見其投入AI算力的決心。

將推動算力網絡,加速邁向算網3.0新階段 。」4月的「算力網絡大會」上,董事長楊傑強調,中國移動將加快算力網絡規模部署和套用。

8月初,楊傑在業績會上表態,圍繞AI,正積極推進「三個萬」:投產萬卡智算集群,訓練萬億級token數據,釋出萬億參數大模型。

一系列密集動作,顯現出其算網建設的雄心。

它的另一重關鍵角色,是在打造大模型訓練的超級工廠過程中,擴大「朋友圈」,拉著本土廠商夥伴,共同沖刺。

據介紹,中國移動智算中心(呼和浩特)部署2萬張AI加速卡, 國產化算力占比超85%

「聚合產業鏈上下遊力量,推動國產算力生態的建設與繁榮,中國移動這樣的央企,必須發揮串聯、協同、帶動作用。」李道通說。

他提到,中國移動已實作昇騰、寒武紀等5類國產化智能算力芯片落地。

底座建好後,中國移動將大幹一場。

圖片來源:中國移動,除標註外