当前位置: 华文世界 > 科技

万亿中国移动,呼和浩特盖机房

2024-08-27科技

记者丨何己派 编辑丨鄢子为

从呼和浩特市区驱车20公里,一路向南,进入和林格尔新区,中国移动智算中心(呼和浩特),坐落于此。

嗡鸣声中,一排排黑色机柜整齐列队,让算力如同水电,即取即用,沿着纵横的光纤网络,流向AI竞技场。

历经7个多月建设,今年6月底,该智算中心的全部集群正式上线。

今年中国移动要全面实现‘东数西算’8大枢纽间的高速互联 。呼和浩特这一站,开通的是首条400G全光省际骨干网。」中国移动云能力中心智算专家李道通向【21CBR】记者表示。

按规划,该公司将打造万卡级智算集群标杆,今年还将商用哈尔滨自主可控超万卡集群,充分满足大模型集中训练需求。

AI浪潮下,万亿市值的中国移动,由云向算,正布一盘大棋。

天然机房

战略级项目选址呼和浩特,中国移动看上了这里得天独厚的资源、地理优势。

地处北纬40-42度之间,既是大数据产业黄金纬度区,又为京津冀环渤海经济圈腹地。

当地地质结构稳定,自然灾害少,可谓「天上有风光、地下有煤炭、手里有电网」,发电量位居全国第一,且电价低廉, 数据中心平均用电价格稳定在0.32元/度,为全国最低

「这里年平均气温7.7℃左右,全年低于10度的时间,能占50%以上。」

中国移动呼和浩特数据中心工程师孟繁跃介绍道,「天然环境就能给数据中心自然散热,用电成本得以大幅降低。」

「天选之地」呼和浩特,已落地建设十个智算中心,集结包括中国移动在内的一批龙头,于两个月前,拿下「中国云谷」的称号。

孟繁跃表示,团队做过测算,从呼和浩特到北京,「乘坐」400G全光网络,最短只需3.5毫秒,「基本与北京当地时间没有太大差别。」

「焕新」前的中国移动呼和浩特数据中心,肩负东数西算布局中「援京助东」使命。

其既满足京津冀高实时性算力需求,也能为长三角等区域提供非实时算力,于2012年开工建设,2016年投产运营,多年发展下来,总客户数上百家。

在做好通算业务的基础上,顺应AI浪潮,该中心布局智算。

智算项目的建设, 总投资46.6亿元,部署8个集群 ,建设759个机架,智能算力规模高达6.7EFLOPS(每秒670亿亿次浮点运算)。

6.7EFLOPS,什么概念?

与自身对比的话,中国移动呼和浩特数据中心已投产使用9栋机楼,这一单体智算中心的算力规模,比其他8栋楼加起来的算力总和还要多。

系统搭建

「建智算中心,是个复杂的系统工程。」

中国移动呼和浩特数据中心副总经理李程贵提到,相较通算,做智算中心的业务模型估算,难度更大。

他表示,从启动施工到第一阶段的基础设施具备装机条件,用了15周时间,较标准工期缩短一半以上。

工期紧张,又涉及工程管理、设备采购等多环节的协同推进,给团队带来极大挑战。

该中心规模化采用新技术,在基础设施的设计阶段,需要做大量协同规划,亦考验实施阶段的系统稳定性。

例如,在制冷方面, 该中心首次大规模引入冷板式液冷方案 ,配套闭式冷却塔、小母线等新型节能技术,实现PUE降至1.15。

面对初期建设运维时,GPU卡故障频发、网络链路不稳、软件系统缺陷等挑战,中国移动从三个维度下手。

一是打造一套工具,研发自动化智算中心交付体系,实现标准化流程、自动化部署与高效协同作业,提供开箱即用、性能卓越的稳定运行环境,从而提升部署效率与服务质量。

二是搭建一个大平台,通过算网存软硬件智能监控处置平台, 对AI训练任务进行全生命周期管理 ,快速定位问题,确保训练高效稳定进行。

三是组建专业集成调优团队,聚焦数据治理等关键环节,提供全栈服务。

目前,对内,中国移动智算中心(呼和浩特)支撑集团旗下九天大模型的训练,对外,满足行业客户智算业务需求,例如中石油昆仑大模型的训练。

算网雄心

今年,三大运营商不约而同地加码算力网络建设,尤以中国移动的步子迈得最大。

一个明显变化是,其资本支出,由5G向算力倾斜——今年用于5G网络的开支,预计同比减少21%;用于算力的,预计增长21%,达到475亿元。

按其规划, 智能算力的增速,将远超通算

2024年通用算力将新增3 EFLOPS,达到9 EFLOPS;智能算力将新增7 EFLOPS以上,达到17 EFLOPS。

4月,中国移动公示2024年至2025年新型智算中心采购招标公告,此次采购包含AI服务器7994台,中标总金额达到约191亿元,可见其投入AI算力的决心。

将推动算力网络,加速迈向算网3.0新阶段 。」4月的「算力网络大会」上,董事长杨杰强调,中国移动将加快算力网络规模部署和应用。

8月初,杨杰在业绩会上表态,围绕AI,正积极推进「三个万」:投产万卡智算集群,训练万亿级token数据,发布万亿参数大模型。

一系列密集动作,显现出其算网建设的雄心。

它的另一重关键角色,是在打造大模型训练的超级工厂过程中,扩大「朋友圈」,拉着本土厂商伙伴,共同冲刺。

据介绍,中国移动智算中心(呼和浩特)部署2万张AI加速卡, 国产化算力占比超85%

「聚合产业链上下游力量,推动国产算力生态的建设与繁荣,中国移动这样的央企,必须发挥串联、协同、带动作用。」李道通说。

他提到,中国移动已实现昇腾、寒武纪等5类国产化智能算力芯片落地。

底座建好后,中国移动将大干一场。

图片来源:中国移动,除标注外