当前位置: 华文世界 > 科技

中国电信开源1000亿参数AI模型,纯国产硬件训练

2024-10-09科技

就在我们欢度国庆时,中国电信人工智能研究院在10月2日宣布,其使用国产算力平台训练出了一个拥有1000亿参数的AI模型——TeleChat2-115B。据其在GitHub上公布的信息显示,开源TeleChat2-115B模型使用10万亿个高质量中英文语料进行训练。

一般而言,AI模型训练用的参数越多意味着其结果准确度越高。就目前而言,使用参数最多是Meta发布的Llama模型(超过4000亿个参数),然后是OpenAI的o1模型(约2000亿个参数)。尽管中国电信开源的TeleChat2-115B模型参数与二者还有一定的差距,但都在千亿级别,表明尽管受到美国的各种限制,但国内企业在AI领域的发展依然接近甚至达到国际领先水平。

而且,更难能可贵的是,这千亿大模型TeleChat2-115B不仅「完全使用国内算力进行训练,并且是开源的」。据中国电信人工研究院在GitHua上的公开信息显示,其AI训练平台为Ascend Atlas 800T A2训练服务器。

稍微熟悉服务器或AI行业的人应该都知道,这是某遥遥领先厂商完全自主研发的AI服务器(Ascend Atlas 800T A2),其内可配置两颗鲲鹏920系列处理器(如[email protected]核心的7265或者[email protected]核心的5250处理器),以及32个DIMM内存插槽,最大内存容量可达2TB,每处理器最大可支持40条PCIe 4.0通道。

尽管在这款AI服务器的产品详情页面并没有显示配备何种AI加速器,但懂的都懂……

据相关信息,中国电信拥有超过5亿的有线宽带和5G无线用户,年收入约为5千亿元。作为国内的三大运营商之一,中国电信有技术、有能力也有预算去探索国际前沿的AI技术,而其在AI领域积累的经验成果将给全球所有企业都提供实践参考!