當前位置: 華文世界 > 數位

KP920跑分測試,發現一個問題……

2024-03-22數位

2019年,HW在ARM v8.2公版架構基礎上設計出鯤鵬920處理器,主頻2.6GHz,每顆64核心(8M一級緩存+32MB二級緩存+64MB三級緩存),最高支持四路256顆核心。

當時釋出的SPEC CPU 2017跑分成績是128核int_base 318分。

最近我也搞到了一台TaiShan 200伺服器,一起來看看跑分結果如何。

單核測試

首先我用了SPECRate2017,跑1copy測試了下單核效能。

為了保證跑分的合理性,我們使用的是SPEC官網上,由華為提供的測試配置檔及GCC編譯參數(在此科普下,SPEC CPU 2017的speed測試可以使用多執行緒技術,並不是單核效能,想測單核只能跑rate的1copy),測試結果為單核int基準3.51分,fp基準3.37分。

以下是鯤鵬測試結果,測試環境如圖所示:

如果給鯤鵬測試結果找個對比參照,測試結果基本和LX的3A5000持平,比單核效能更有優勢的x86架構是要差一點的。HG二代7260的測試結果,int base4.35分,fpbase可達6.51分(未找到調優檔,僅使用了軟體內建的GCC配置檔)。

坦誠說,ARM處理器單核效能較低也比較正常,在伺服器領域常用堆核心來解決單核算力不足問題,達到低能耗高效能的效果。不過如果遇上套用沒做指令集最佳化,會存在單核孱弱限制效能發揮的情況,導致了在看似效能不錯的ARM CPU,效能跑不滿、跑不快。

多核測試

接下來,我依舊是同樣環境跑了下128核成績,發現有些問題。

如上圖所示,128核int_base292分,fp_base251分,和官方釋出的成績有縮水,整體低了20多分。

基本我的測試環境和配置檔和官變異數不多,分數差距卻不小。這個原因我也是沒想明白,可能官方成績有應試調優;又或者是我測試的這台機器,CPU體質不好?