当前位置: 华文世界 > 科技

壁仞科技副总裁:解决算力瓶颈需从三维度着手

2024-08-26科技

近日,壁仞科技副总裁兼AI软件首席架构师丁云帆在谈及计算瓶颈时表示,解决算力瓶颈问题需要从三个维度考虑:硬件集群算力、软件有效算力、异构聚合算力。他认为,通过做好这三个维度的工作,即使国产AI芯片单个算力不强,也能通过综合手段提升算力,满足国内大模型训练的需求。

丁云帆还提到,壁仞科技在2020年设计的第一代产品中采用了chiplet架构,国外巨头如英伟达B100和英特尔Gaudi3也采用了类似思路,以最先进制程结合chiplet来提升单卡算力。公司使用三级的异步checkpoint技术,结合GPU的显存和CPU内存以及多节点内存备份系统,已能大幅降低故障恢复成本。

壁仞科技早前发布的首款通用GPU芯片BR100创下全球算力纪录,16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别。该产品对比英伟达在售旗舰GPU在Int8、BF16、TF32/TF32 、FP32数据格式下,性能优势分别达到了3.3倍和13.1倍。

以上是壁仞科技副总裁丁云帆关于算力瓶颈解决方法以及公司首款通用GPU芯片BR100的介绍。