中国电信开源1000亿参数AI模型，纯国产硬件训练

2024-10-09科技

就在我们欢度国庆时，中国电信人工智能研究院在10月2日宣布，其使用国产算力平台训练出了一个拥有1000亿参数的AI模型——TeleChat2-115B。据其在GitHub上公布的信息显示，开源TeleChat2-115B模型使用10万亿个高质量中英文语料进行训练。

一般而言，AI模型训练用的参数越多意味着其结果准确度越高。就目前而言，使用参数最多是Meta发布的Llama模型（超过4000亿个参数），然后是OpenAI的o1模型（约2000亿个参数）。尽管中国电信开源的TeleChat2-115B模型参数与二者还有一定的差距，但都在千亿级别，表明尽管受到美国的各种限制，但国内企业在AI领域的发展依然接近甚至达到国际领先水平。

而且，更难能可贵的是，这千亿大模型TeleChat2-115B不仅「完全使用国内算力进行训练，并且是开源的」。据中国电信人工研究院在GitHua上的公开信息显示，其AI训练平台为Ascend Atlas 800T A2训练服务器。

稍微熟悉服务器或AI行业的人应该都知道，这是某遥遥领先厂商完全自主研发的AI服务器（Ascend Atlas 800T A2），其内可配置两颗鲲鹏920系列处理器（如[email protected]核心的7265或者[email protected]核心的5250处理器），以及32个DIMM内存插槽，最大内存容量可达2TB，每处理器最大可支持40条PCIe 4.0通道。

尽管在这款AI服务器的产品详情页面并没有显示配备何种AI加速器，但懂的都懂……

据相关信息，中国电信拥有超过5亿的有线宽带和5G无线用户，年收入约为5千亿元。作为国内的三大运营商之一，中国电信有技术、有能力也有预算去探索国际前沿的AI技术，而其在AI领域积累的经验成果将给全球所有企业都提供实践参考！