当前位置: 华文世界 > 科技

全球最高算效智算中心上线,天府智算对AI产业的深远启示!

2024-07-23科技

全球最高算效智算中心上线,天府智算对AI产业的深远启示!

四川简阳位于四川腹地,控巴海峡,为成渝和川鄂的咽喉要道,成渝和川鄂的咽喉要道,自古以来就被誉为"天府雄州"。

"天府雄州"这一特殊的区位优势,在进入数字经济时代后,又一次显示出了它的重大战略价值。简阳市作为成渝地区「天府」区域的核心区域,将对四川「数字经济」乃至成都「人工智能」的发展起到积极的促进作用。

日前,简阳市「天府」计算机西南区域运算中心正式投入使用,而成渝区域计算机二期工程也已完工。同时,它也将是全国规模最大的超算中心,它既代表着未来计算中心的发展趋势,又将推动人工智能产业的高速发展。

高效率的计算能力才能推动人工智能行业高质量发展

四川是"天府之国",它有着完整的工业体系和丰富的教育资源。到了2023年,四川的 GDP将在全国排名第5。四川从以往的「量」和「质」两个维度出发,确立了「新质生产力」和「高品质」这一核心思想,就是要把人工智能产业做好,把人工智能等数字技术充分利用起来,让传统产业变得更加强大。

成都市作为一个典型,近几年来,成都市已经建成了一批人工智能企业、科研院所和创新平台,从基础层到技术层,从基础层到应用层,从基础层到应用层,已经建立起一个完整的产业链。【成都市人工智能产业高质量发展三年行动计划(2024-2026年)】明确提出,成都将在「十四五」期间,以「十四五」为目标,力争实现「十四五」「五年」,「六个一」、「五个一」,「五个代表」、「六个代表」和「七个代表」。

可以预计,在四川经济全面转型、人工智能产业持续发展的背景下,对计算能力的需求将会非常庞大,对人工智能的高品质计算能力是不会短缺的。能投天府云执行董事兼总经理任国斌也清楚地指出,相对于四川地区的经济规模以及人工智能产业的发展,目前的计算能力建设还处在一个高速发展的时期,还存在着一些不足。

任国斌,天云号公司的常务董事

在这种情况下,构建高性能、智能化的计算中心是一种重要的潮流。在解决智能计算中心规模问题的同时,计算效率(MFU)在解决计算资源供求矛盾方面的作用也日益凸显。而实际上,成渝计算机中心的启用,也代表着它在高端计算中心上的成功运用。

正如我们所知,如果没有人工智能的生产性应用的爆发与普及,人工智能行业将会获得高质量的发展。另一方面,产生型人工智能要求建立在海量自然语言或多模态数据基础上,对大规模人工智能模型进行连续训练,通常需要几千到几万个 AI集群,对 AI计算能力的需求也远远超过了现有应用。

因此,其训练计算能力的有效性不仅关系到模型训练的时间、成本乃至效果,更是影响人工智能生产性研发创新和人工智能产业高质量发展的重要因素。毫无疑问,天府计算机西南中心为提升 MFU所做的贡献是毋庸置疑的。

据了解,为了使 MFU更好地发挥作用,我们将与浪潮信息人工智能项目组紧密协作,在集群体系结构、高速互联、资源调度等方面进行全方位的优化;在此基础上,借鉴浪潮大模型的训练与优化经验,研究面向张量并行、流并行、数据并行的张量张量。在此基础上,借鉴浪潮等大模型的训练与优化经验,有针对性地优化分布式学习策略,通过张量并行、流并行性及数据并行性等手段,实现模型结构与超参量的精细调控。本项目拟通过张量并行、流式并行与数据并行化设计,以及在训练过程中对模型结构与超参量的精细调整,实现千亿参量人工智能大模型的训练效能提升至80%,创造行业内人工智能大模型训练效能的新高度。

在充分发挥 MFU (数理效能)优势的同时,天府计算西南中心在能源效率上也做出了大胆的创新与突破,以42 kW风冷箱作为创新的切入点,很好地解决了数据中心的高密度分布、高效散热以及机房维修改造等问题。

智能计算风冷计算机:顺应高密度发展的潮流

高密度是离子交换膜技术今后的发展方向。

随着人工智能行业的迅猛发展,其计算能力、散热能力、运行维护能力以及建造方式等方面均有不同程度的变化,使得其高集成度成为必然趋势。对数据中心来说,高密度化的功能有两个:第一,大范围地部署高密度的机柜,以达到计算单元的计算能力;二是将直接促进数据中心的能效提升和先进节能技术的发展,从而更好地适应数据中心的绿色、低碳需求。

针对四川地区, IQC中部署了数量庞大的 AI服务器,导致单个机房功耗和能耗大幅提升,而在密集分布的情况下,如何有效地降低系统的散热效率是一个亟待解决的问题。二是四川省发布数据中心能效政策,要求集群启动区内新建数据中心 PUE不得超过1.25,现有的能耗技术已不能适应这一要求。三是在构建方式、计算机系统等方面,要与 IQC及将来计算能力服务的建设要求保持一致。第三,在构建方式、机房等方面,要满足未来算力业务发展的需要。

因此,华东理工大学的天府云和浪潮信息合作,共同开发出42 kW的智能风冷计算库,并在西南地区的天府智慧计算中心进行了大规模的应用。」浪潮信息技术有限公司产品经理赵帅说:「42 kW的智能制冷系统,实质上就是一座高度密集、模块化的数据中心。

42 kW智能制冷能量存储是面向人工智能服务器的新型智能计算架构,具有高功耗、集成运算/存储/网络、高效集成、机柜、配电、 UPS、空调、监控、消防等多个方面的功能。本项目以标准化、去工程化、优化运行效率、智能管理为原则,具备「快-省时-省地-高密度-省地-节能-节能-安全-省省」的核心优点。它以标准化、去工程化、优化运作效率、智能管理为原则,具备「快发货-省时-高密度配送-省地-节能-节能-安全-便捷」的核心优点。

随着人工智能行业对计算能力的迫切需要,以「天府智算」为代表的「智慧计算中心」已经成为一种普遍的需求。在42 KW的智能风冷计算库的基础上,通过预留场地、制冷量和电量,在一个星期之内就可以安装完毕,工期减少了70%。

42 kW密集分布的智能风冷机箱,可使单机功率密度由3-7 kW提升至42 kW,形成超密集计算,在单元面积上突破运算能力,降低建筑面积60%。

令人赞叹的是,42 kW的智能风冷蓄能装置采用风冷式制冷方式,将中压到终端馈电的全功率简并源与高效率的 UPS系统相结合,可有效减少30%的电力损失。本项目提出了一种新型的高效制冷方式,即采用全封闭的冷热通道+排间的高温进气方式,将系统的能量效率提升10%,显著减少能源利用率。百分之二十五以上。

另外,42 kW的智能计算空冷算力库,通过 AI管理平台,对 AI的所有功能进行了充分的集成,对整个数据中心进行了统一的管理,从而达到了一个真正的 AI监控、管理和维护数据中心的目的。再加上 AI的智能调整算法,可以在数据中心和服务器之间进行双向的失效预警,同时还能提高30%的安全性。

"目前,单靠智能计算中心内的人工智能服务器已经无法满足需求,必须建立一个完整的人工智能服务器来支持人工智能服务器的部署与应用。赵帅接着说:「浪潮科技和能源投资天府云在西南计算中心对商业需求进行了充分的分析,使用了42 kW的智算风冷计算机仓解决方案,第一期已经建成,可以满足目前的人工智能产业对计算能力的要求。」

A. 建立一个「聪明的计算机中心」模型

IDC发布的【全球人工智能支出指南报告】预计,中国对人工智能的投入将在2027年前达381亿美金。随着国家政策的出台,以及产业转型升级,包括人工智能在内的高端基础设施将是今后5年内市场投资的重点。

随着我国经济向高品质、新、高质量发展的迫切需要,构建高端计算中心已成为全社会和全行业的共识。从规划、设计到正式投入使用,智库西南智脑中心在未来的智慧计算中,都将起到示范作用。

首先,「天府计算西南算力中心」在规划和需求上达到了极高的匹配度,提前谋划,贴近需求,提前规划,及时上线,为成都市人工智能产业的高质量发展提供了有力的保证。目前,「天府计算西南算力中心」主要面向高校科研机构和科技型企业,全方位支持大数据,深度学习,智能语音语义,生物医学等应用。

其次,在行业协同创新方面,以「天府智库」为代表的「西南计算所」具有代表性。智能计算中心是人工智能时代对数据中心进行重构的产物。浪潮科技与能源投资「天府云」紧密合作,自主研发出42 kW智能制冷空调系统,使 AI大数据模型的运算效率提高到80%以上。

三是预期将来外销,有利于该产业。面向人工智能产业高质量发展的迫切需要,本项目研究成果将为我国西南地区智能计算中心提供重要的技术支撑,并为其它智能计算中心的建设提供借鉴。

"天府智算网西南42 kW智算风冷计算库的建成,将在客户化服务方面取得重要突破,有力推动了四川人工智能产业的发展。"赵帅做出了最后的结论。