當前位置: 華文世界 > 科技

搶當輝達H200「平替」,AMD新款AI芯片年底前投產

2024-10-12科技

當地時間10月10日,AMD釋出新一代AI芯片MI325X,多項效能超越輝達p00芯片,試圖進一步撼動輝達在數據中心GPU市場的壟斷地位。

MI325X沿用CDNA 3的GPU架構,和上一代MI300X芯片搭載HBM3記憶體相比,MI325X升級到HBM3e(第五代)高頻寬記憶體,擁有256GB的記憶體容量和6TB/s的頻寬,容量和頻寬分別約為輝達p00的1.8倍和1.3倍。

算力層面,MI325X在8位元浮點數(FP8)和16位元浮點數(FP16)精度下的峰值理論運算效能,分別為2.6 PFLOPs(即每秒2.6千萬億次浮點運算)和1.3 PFLOPs,比p00均高出約30%。浮點數越小,可以減少儲存需求並提高計算吞吐量。

AMD MI325X芯片圖片。

為了更直觀凸顯效能優勢,10月10日的新品釋出會上,AMD CEO蘇姿豐(Lisa Su)還提及MI325X在Meta Llama模型的訓練和推理效能數據——

由8張MI325X組成的伺服器平台,在Llama-3.1 405B模型上的推理效能,比輝達p00 HGX平台高出40%;在AI訓練上,單張MI325X訓練Llama-2 7B的訓練效能為p00的1.1倍,8張MI325X訓練Llama-2 70B的效能與p00持平。

AMD預告稱,MI325X有望於今年第四季度投產,並從明年第一季度供貨給戴爾、惠普、聯想等合作廠商。

今年6月,輝達和AMD相繼宣布,將GPU叠代節奏從「兩年一更」加速為「一年一更」。此次釋出會上,AMD披露了後續的年更路線圖:下一代MI350系列的首款芯片MI355X,預計2025年下半年問世;2026年進一步叠代為MI400型號,並使用新一代CDNA架構。

其中,MI355X升級為CDNA 4架構,配置288GB容量、8TB/s頻寬的HBM3e高效能頻寬記憶體。算力效能上,MI355X在FP8和FP16精度下的運算效能比MI325X提升約77%;同時還將新增對FP4和FP6數據類別的支持,峰值運算效能達9.2PFLOPs。值得一提的是,MI355X會首次采用3納米制造工藝,和輝達預計2026年上市的下一代Rubin GPU的制程相同。

大模型浪潮催生數據中心對GPU的熱切需求,蘇姿豐預測,到2028年,數據中心、AI和加速器市場的價值將達到5000億美元。市場調研機構的數據顯示,輝達占據數據中心GPU市場9成以上的份額,作為其最核心競爭對手的AMD僅能爭搶少量的「蛋糕」。

但AMD去年12月推出MI300X和MI300A兩款AI芯片,憑借性價比優勢,日漸得到行業巨頭青睞。微軟、Meta和甲骨文公司此前都宣布采用MI300X芯片。近日又有韓媒報道稱,三星斥資約270億韓元購買約2000顆MI300X芯片,這是三星首度引入非輝達AI GPU。

公司財報顯示,得益於MI300X等芯片的出貨量大增,AMD今年第二季度數據中心業務營收達28億美元,同比增長115%,環比增長21%。該公司在二季度財報電話會上披露,MI300芯片的季度收入首次超過10億美元,預計數據中心的GPU收入今年有望超過 45億美元。

采寫:南都記者 楊柳