2024年9月26日,英特尔推出了专为高性能人工智能任务设计的Xeon 6系列和Gaudi 3芯片。近年来,英特尔面临着诸多挑战,尤其是在苹果硅片iPhone发布之后,以及由Nvidia和AMD主导的人工智能和数据中心芯片行业兴起之时。然而,面对这些挑战,英特尔并没有坐视不理,而是宣布推出新的竞争选手。
这些被称为Xeon 6900 P-core系列的芯片提供了多达128个内核,能够处理极其繁重的AI工作负载,其性能比前辈提升了两倍,同时拥有更高的内核数、更大的内存带宽和嵌入式AI加速功能。
性能提升显著
在Gaudi系列方面,新款Gaudi 3 AI加速器芯片专注于生成式AI应用,配备了64个Tensor CPU核心、八个矩阵乘法引擎以及128GB的HBM2e内存。相比于Nvidia的p00芯片,Gaudi 3在LLaMa 2 70B推理上的吞吐量提升了20%,并且在性价比方面实现了翻倍增长。
除了芯片的设计与制造之外,英特尔还与Dell和Supermicro合作,开发了「协同工程系统」,这些系统特别针对两家公司的特定AI需求。Dell正在利用Gaudi 3和Xeon 6芯片开发基于RAG(Retrieval-Augmented Generation)的解决方案。
在AI芯片领域,AMD从英特尔的困境中受益良多,通过设计强大芯片并由台积电制造,这一模式取得了巨大成功。英特尔一直在尝试复制或打破这种模式,但成效有限。基于Zen 5架构,AMD计划在2024年下半年发布其第五代EPYC Turin 3nm数据中心芯片,这款芯片具备最多192个内核和384条线程,在技术参数上至少能够与Xeon和Gaudi芯片相媲美。
在备受瞩目的Top500榜单中,虽然尚未完全投入运行的英特尔驱动的Aurora超级计算机在整体排名上屈居AMD驱动的Frontier之后,但在AI基准测试中却夺得了头筹。