当前位置: 华文世界 > 科技

最高算效智算中心上线,天府智算对AI产业有何启示?

2024-07-21科技

最高算效智算中心上线,天府智算对AI产业有何启示?

四川简阳地处川中,扼巴峡要冲,自古为成渝、川渝及鄂州交通要冲,素有"天府雄州"之称。

"天府雄州"独特的区位优势,在进入数字经济时代后,再一次显示出它的巨大战略价值。简阳市将成为成都地区「天府数据中心」的主基地,对于支撑四川数字经济、促进成都人工智能产业的快速发展,具有十分重要的意义。

近日,位于四川省简阳市的「天府计算机西南中心」正式启用,标志着「天府」成渝区域计算中心的阶段性建设已全部完工。同时,它也将成为国内规模最大的计算中心,不仅代表着未来计算中心的建设方向,更将推动人工智能产业向更高水平的方向发展。

算力效率比是人工智能产业高质量发展的基础。

四川被誉为"天府之国",拥有完整的工业体系和丰富的教育资源。到2023年,四川的经济总量将位居全国第5。四川已经从过去的为经济要量变到质的并重,确立了发展新的高质量生产力和高质量经济发展的核心理念,那就是要把人工智能产业做优做强,用人工智能等数字技术为传统产业提供全方位、深层的赋能。

成都市近几年聚集了一批人工智能企业、科研院所和创新平台,已经形成了一个完整的产业链,从基础层到技术层,再到应用层,成都市已经形成了一个完整的产业链。【成都市人工智能产业高质量发展三年行动计划(2024-2026年)】明确提出,到2026年,成都人工智能核心产业规模将突破1,500亿元,带动相关产业规模突破1万亿元,成为我国人工智能产业发展高地。

可以预见,伴随着四川经济向高质量发展的转变,以及人工智能产业的不断发展,对算力的持续需求将会越来越大,而高质量的人工智能计算能力是不会短缺的。能投天府云总经理任国斌直言,相对于四川地区的经济规模以及人工智能产业发展的需要,数据中心等算力基础设施建设还处于追赶与追赶的阶段,目前正处于快速发展阶段。

任国斌,天府云常务董事和总经理

在这种情况下,建设高层次的智能计算中心是一种重要趋势。除智能计算中心规模外,为平衡未来算力供需矛盾,计算效率问题日益突出。事实上,「天府计算西南中心」的启用,无疑是「成渝计算中心」向「高端计算中心」迈进的一次成功实践。

众所周知,生成型人工智能应用的爆发与普及是人工智能产业高质量发展的基础。另一方面,生成型人工智能需要建立在海量自然语言或者多模态数据之上,对大规模人工智能模型进行持续训练,通常需要几千甚至上万个集群来支持,其计算效率远超现有应用。

因此,大规模人工智能集群的计算效率直接关系到模型的训练时间、成本甚至效果,并潜移默化地影响着人工智能的创新与发展。天府西南计算中心无疑对改善 MFU的发展起到了至关重要的作用。

据了解,为了进一步完善 MFU,天府智慧计算西南中心与浪潮信息人工智能团队紧密合作,在集群体系结构、高速互联、计算能力编程等方面进行全面优化;在借鉴浪潮信息大数据源模型经验的基础上,对大数据源模型模型结构及超参数进行针对性优化;借鉴浪潮信息大数据源模型训练与优化经验,有针对性地优化分布式训练策略,实现模型结构与超参量的精准调整,实现张量并行、流式并行与数据并行。通过对张量并行、连续流并行与数据并行的合理设计,对模型结构与超参数进行精准调整,最终实现千亿参数规模大规模人工智能模型的算术训练效率(MFU)提升至80%,创造业界大规模人工智能模型算术训练效率新纪录。

天府计算西南计算中心除在 MFU上取得优异成绩外,更在数据中心能源效率上做出了大胆创新与突破,以天府计算42 kW风冷计算仓作为创新切入点,完美地解决了高密度数据中心部署、高效散热、机房维修改造等问题。

风冷计算机智能计算:顺应高密度趋势

高密度化将是未来 IQC发展的一个重要方向。

随着人工智能产业的迅猛发展,数据中心在计算能力、散热能力、运行维护以及建设方式等方面均有不同程度的变化。高密度对数据中心的影响主要体现在两个方面:第一,大规模部署高密度机柜,实现单位面积内的运算能力;二是将直接促进数据中心能效提升和先进节能技术的发展,以满足数据中心的绿色低碳需求。

以四川为例,大量人工智能服务器部署于智能计算中心,造成单个机柜功耗及能耗上升,数据中心高密度部署面临高效散热问题。二是四川省发布数据中心能效政策,要求集群启动区新建数据中心能效控制在1.25以下,传统节能技术已不能满足需求。三是建设模式、机房环境等方面要满足 IQC及未来算力业务建设的需要。第三,数据中心的建设方式、机房环境等都要与未来算力服务的建设要求相匹配。

为此,国投天府云联合浪潮信息开展联合创新,成功研发出42 kW风冷智能计算仓,并在西南地区的天府智能计算中心实现了大规模应用。浪潮信息服务器产品线总经理赵帅表示,「42 kW智能制冷计算仓本质上就是一座高密度、模块化的数据中心」,这也是我们目前所面临的主要问题。

42 kW智能冷却智能计算仓,以人工智能运算能力为核心,是面向人工智能服务器的新一代智能计算架构,支持高密度算力部署,集成计算/存储/网络,高效集成机柜,配电, UPS,空调,监控,消防等系统。它以标准化、去工程化、优化运营效率、智能化管理为原则,其主要优点有:快速交货-省时-高密度部署-省地-节能-安全-省心-省心。它以标准化、去工程化、优化运作效率、智能化管理为原则,主要优点有:快速交货-省时-密集部署-省地-节能-节能-安全-省心-省心。

当前,以西南智能计算中心(天府)为代表的智能计算中心正面临着快速响应人工智能产业发展的迫切需求。使用 Smart Computing的42 KW风冷计算库,数据中心只需要预定场地、制冷量和电量,就可以在一个星期内完成安装。

高密度风冷型42千瓦智能计算仓实现后,单机柜功率密度由3-7千瓦提高到42千瓦,产生超高密度运算能力,实现单位面积计算能力突破,建筑用地减少60%。

重要的是,42 kW风冷智能计算仓采用风冷风冷方式实现高能效,集成中压到末级馈线全功率单路供电及高效率不间断电源系统,可有效降低30%的能耗。本项目拟采用全封闭的冷热通道+空调列间水循环模式,使制冷效率提升10%以上,能效显著降低,较传统风冷数据中心整体节能25%以上。百分之二十五以上。

另外,42千瓦智能计算空调算仓还将人工智能的能力进行了充分的整合,通过人工智能管理平台对数据中心进行统一管理,并结合智能人工智能调优算法,在数据中心层和服务器层都能实现双向故障预警,真正将监测、管理、运维与人工智能有机地结合在一起,安全可靠性提高30%。

"当前,仅靠智能计算中心中的人工智能服务器已不能满足需求,必须以更高层次的数据中心来全面支撑人工智能服务器的部署与应用。赵帅补充道:「浪潮信息与能源投天府云在西南算力中心对业务需求进行了充分的分析,一期采用42 kW风冷算力存储方案,现已投入使用,以满足当前人工智能产业对算力的需求。」

A. 建立"智能信息技术中心"的模式

根据 IDC发布的【全球人工智能支出指南报告】,中国对人工智能的投资预计将在2027年达到381亿元人民币。随着国家政策及产业转型升级政策的推动,未来5年,智能计算中心等先进基础设施将成为市场投资的重点。

随着我国经济向高质量、新生产力的快速发展,建设高层次的计算中心已成为全社会乃至整个产业共同的目标。从规划、设计到上线运营,天府智库西南智算中心无疑将成为未来智能计算中心建设的典范。

首先,「天府计算西南算力中心」以超前规划、贴近实际需求的方式,从超前规划到快速投入使用,保障了成都市人工智能产业的高质量发展,实现了规划与需求的高度匹配。目前,「天府」西南算力中心已经为各大高校和科技企业提供了大量的算力,在大数据,深度学习,智能语音语义,生物医学等方面有着广阔的应用前景。

其次,成都西南智能计算中心是一个典型的行业协同创新案例。智能计算中心是人工智能时代对数据中心进行重新定义的产物,它涉及到计算能力、环境和构建模式等多个方面。浪潮信息与能源投资「天府云」紧密合作,创新研发出42 kW智能制冷计算仓解决方案,使大规模人工智能模型训练效率提高到80%以上。

三是未来有望外销,使行业受益.面向未来人工智能产业高质量发展的重大需求,智能计算42 kW风冷算力仓解决方案,不仅可以推动天府智库西南算力中心建设,而且有望为其他智慧计算中心建设提供最优借鉴方案,具有重要的产业价值。

"随着天府智算42 kW风冷计算仓的交付,我们将在数据中心定制服务方面取得重大突破,有力推动了四川人工智能产业的发展。"赵帅最后说道。