当前位置: 华文世界 > 科技

智算中心的暗涌与灯塔

2024-10-12科技

近年来,伴随AI技术的发展,智算中心作为智能化时代承载AI算力服务的关键新型基础设施,扮演的角色愈发重要。根据国际数据公司IDC的数据显示,当前我国超过 30 个城市正在建设或提出建设智算中心,未来5年我国智能算力规模年复合增长率将达52.3%,智算中心的建设大多结合当地经济开发区或高新技术开发区来布局,通过结合产业需求发挥智算中心的高效赋能作用,智算中心的创新发展,将进一步为人工智能夯实「算力底座」。

在政策层面,为响应建设全国一体化数据中心体系,自2021年起,中央部委联合下发【关于加快构建全国一体化大数据中心协同创新体系的指导意见】【全国一体化大数据中心协同创新体系算力枢纽实施方案】【新型数据中心发展三年行动计划(2021-2023年)】等一系列文件,推动数据中心的基建化,为中国数字经济发展、中国经济的整体转型提供新时代的「铁公基」。

与此同时,智算中心的市场竞争也日益激烈。各大科技企业纷纷加大在智算领域的投入,通过技术创新和模式创新来抢占市场先机。

值得注意的是,智算中心市场环境的变化也带来了一系列新的挑战和机遇。一方面,随着算力需求的不断增长,如何提升智算中心的能效比、降低运营成本成为行业关注的焦点;另一方面,随着新兴技术的不断涌现,如何将这些技术应用于智算中心的建设和运营中,实现智能化、绿色化的发展也成为行业探索的方向。

01

暗涌:四大因素掣肘,

智算中心建设从来都是系统工程

目前制约我国智算中心建设和运营的核心问题综合来看共有四个方面,分别是:成本高企、能耗大、技术门槛高和缺乏服务统一性,因此,需要构建和完善运营机制,选择自主可控的技术路线,形成有竞争力和具备长期成长前景的市场格局。

掣肘之一:建设成本高企

智算中心通常配备高性能算力设备,包括 AI 专用芯片及服务器、IB/RoCE无损网络设备、高速并行存储设备等,这些硬件设施的投资巨大,导致初始建设成本非常高昂。与此同时,随着 AI 技术的快速迭代,设备的更新周期缩短,长期投资回报率的不确定性增大。

据网络公开信息显示,以国内四个人工智能计算中心的折合单位算力建设成本投入为例,可以看到从最高的每100P16位算力投入4.6亿,最低的也需要7500万,异常高企的建设成本,成为制约智算中心建设运营的首要原因。

掣肘之二:能耗大成本高,限制产业高质量发展

能耗是衡量智算中心发展水平的重要标尺之一。基于技术突破和监管要求,智算中心的单位能耗总体呈逐年下降趋势,但随着需求的扩展、体量的增大,智算中心总能耗呈现持续大规模增长势头,导致运营成本大幅度上升。

数据显示,中国计算中心的总体用电量一度连续8年涨幅12%以上。2018年,国内计算中心的用电总量为1608.89亿千瓦时,占全国用电总量的2.35%。据中国科学技术信息研究所预估,在信息技术产业大发展前提下,到2023年算力需求将比2019年增长66%,能耗总量将随之提高,高能耗成为制约产业高质量发展的一个瓶颈。因此,如何优化计算中心的电能使用效率(PUE),成为一项重要挑战。

掣肘之三:技术门槛高

目前国内的智算中心建设当中,通常会面对不同类型的 AI 芯片及服务器厂商、模型厂商、应用厂商等参与的 AI 解决方案市场中。不同的芯片平台、算法模型、数据库、应用层面部分处于垂直一体化「孤岛」状态,始终存在软硬件兼容性问题。跨越的技术壁垒,打破技术孤岛效应,对于智算中心建设及运营至关重要。

另外,由于具体场景的不同,单一的算力方案难以兼顾在不同产业,不同场景下的算力需求,多元算力融合和调度是保证算力利用率的前提。

掣肘之四:缺乏服务统一性

目前,在智算中心的建设过程中,投资主体、建设主体和运营主体往往由不同的单位负责。但是,建设单位往往重视前期设备选型和采购基建,对建后运营的模式、服务标准等的关注和相关知识不足,而运营主体由于缺乏建设过程中的参与,导致在运营中缺少对环境、区位、布局等问题的关注,出现「建设运营割裂」的现象,导致使用体验不佳和成本浪费问题。

02

灯塔:一站式交钥匙工程,

联想打造某数据企业智能中心案例

作为AI原生的智能化全栈解决方案和服务提供商,联想方案服务早在2023年就已推出覆盖咨询、设计、部署和维护的智算中心方案服务,能够一站式帮助客户打造绿色低碳、多元算力、异构智算、云智一体、智能运维、精细运营、安全可靠的智算中心,具体由AI数据中心设计与建设、智能算力、异构智算平台、智能云平台、智能运维平台、智算中心管理平台组成,各模块可灵活解耦组合,满足客户差异化需求,不仅支持大规模数据处理和复杂计算任务,还能根据客户需求灵活调整资源配置,满足不同客户需求。

以某企业智算中心建设运营项目为例,联想方案服务提供的智算中心全周期服务,系统地帮助该企业破局智算中心建设运营难题,夯实了当地打造算力基座的目标。

该智算中心建设位置位于西南部,当地气候独特,且政策上对环保和节能要求严格,在PUE规划上难度较高;另外,该智算中心投资金额巨大,投资主体的现金流承压比较严重;为符合投资主体业务场景和适应未来算力发展趋势,该智算中心在咨询、设计、部署和维护上,有着对全周期服务的客观需求。

针对当地气候和政策需求等问题,联想方案服务在全面分析主流机电方案后,因地制宜结合当地地理气候条件,推荐最优节能路线。采用自然冷却+冷冻水方案实现PUE指标与成本的平衡,打造绿色智算中心;

在解决现金流承压等问题,联想臻算服务提供完美应对。臻算服务以订阅式服务快捷交付服务器、智能存储、GPU智算服务器、超融合等全系列IT基础设施资源,不仅将交易方式从传统的「一次性交付」向「按需订阅、按量计费」的精准方式转变,还可以满足客户对混合场景下算力的需求。通过臻算服务联想方案服务协助客户优化现金流,极大的提高了资金利用率,减轻前期投资压力;

在联想方案服务看来,算力基础设施建设从来不是简单的硬件交付,更不是软件的交付,而是兼具算力基础设施顶层设计、坚实落地和润泽千行百业向智能化「跃迁」的系统性工程。联想拥有业内独有的「端-边-云-网-智」新IT全栈AI的产品、方案和服务,以及数十年的IT沉淀,这也是联想能够为客户提供全栈全周期服务的基础。

在该智算中心项目上,联想为客户提供覆盖咨询、设计、部署和维护的全周期智算中心服务,在建筑优化、模块划分、工艺流程等方面做到对原有建筑条件的扬长避短,同时,引入联想专家团队实现对智算中心基础设施架构的全面优化,将智算中心基础设施与算力设备进行融合,让智算中心具备适应未来算力设施发展的能力。结合自身在智算中心行业的深刻理解和智算中心建设运营经验,联想通过一站式建设和服务为客户提供智算中心的「交钥匙工程」。

6月底,中国电子技术标准化研究院发布首批通过算力服务能力成熟度(CPMM)增强级评估的企业,联想榜上有名。增强级为该评估当前开放的最高等级,获得增强级的企业共四家且均是行业巨头。联想在算力服务上的出众能力已经被官方权威机构认证处于行业第一梯队。

有赖于算力大爆发,以及基于算力的服务突破现有的计算框架,人类在第四次工业革命的今天,可以期待生成式人工智能让下一代互联网变得更美好。联想凭借其数十年的IT经验,以及覆盖智算中心全流程的方案服务,全面加速这一历史进程,为智能化转型的探索提供了全新的思路,更有望让大模型创造真正的社会和产业价值。