晶圓級AI芯片WSE-3效能公布：80億參數模型上每秒生成1800個Token

2024-09-01科技

還在猶豫什麽？好運的機會稍縱即逝！趕緊關註我，一起開啟幸運之旅吧！祝您財運亨通，心想事成！

Cerebras與Nvidia：一場關乎AI未來速度的「 SRAM 對 HBM 」之戰

**一場芯片界的「速度與激情」正在上演。**主角是新晉實力選手Cerebras Systems和老牌巨頭Nvidia。這兩家公司，一個手握著晶圓級AI芯片WSE-3，另一個則擁有GPU王者p00，正圍繞著AI推理速度展開著激烈的角逐。這場比賽，不僅僅是技術之爭，更是關乎AI未來發展方向的路線之爭。

一、 80億參數模型，每秒生成1800個Token：Cerebras向Nvidia發起挑戰

故事要從今年3月說起，Cerebras Systems釋出了第三代晶圓級AI芯片WSE-3，其效能較上一代WSE-2翻了一番。最近，在Hot Chips 2024大會上，Cerebras Systems公布了WSE-3在AI推理方面的驚人表現：在Llama3.1-8B模型上，WSE-3的推理速度比使用NVIDIA p00的微軟Azure等公司快了20倍！

這怎麽可能？

秘密就在於WSE-3采用了44GB的片上SRAM，而p00使用的是HBM3e記憶體。雖然HBM3e擁有更大的容量，但SRAM的速度優勢在AI推理中體現得淋漓盡致。Cerebras Systems行政總裁Andrew Feldman自豪地宣布，WSE-3在執行Llama 3.1 8B模型時，每秒能夠生成超過1800個Token，而效能最好的基於輝達p00的例項每秒只能生成超過242個Token。

這就好比兩輛賽車，Cerebras的賽車雖然油箱小，但發動機強勁，加速迅猛；而Nvidia的賽車雖然油箱大，但發動機動力不足，只能望「 SRAM 」興嘆。