當前位置: 華文世界 > 數碼

A/I陣營誰更強?10款新老AI PC效能對決

2024-10-22數碼
隨著英特爾酷睿Ultra 200V和銳龍AI 300系列新平台的釋出,AI PC正式迎來了第二代產品。雖然受限於新平台釋出初期的產品上市速度不夠快,而導致新產品相對較少,但是我們也盡可能為大家找到了市面上能夠找到的主流產品進行了測試,力求為大家呈現新老兩代AI PC在基礎效能層面的差異。
本次因為是聚焦於AI PC的測試,所以很多不相關的常規測試專案被剔除,而是加入了AI理論和套用效能的測試。
在評測正式開啟之前,我們不妨再來熟悉一下英特爾Lunar Lake和AMD Strix Point兩大新平台的基本架構特性,這也是為了讓大家了解新老兩代AI PC硬件平台究竟有何底層設計上的差異?
·Lunar Lake架構特性簡介
首先是Lunar Lake。
相對於上一代Metoer Lake而言,它將較為復雜的分離式模組化架構設計做了進一步整合。由此前的計算模組、圖形模組、SoC模組、IO模組整合為計算模組和平台控制模組,另外還包含一個沒有實際功能的填充模組。同時它還在整個芯片上整合了LPDDR5x記憶體顆粒,最高支持雙鍊結32GB容量,這也意味著Lunar Lake平台筆記本產品將不會設計單獨的主機板記憶體插槽。
其架構設計目標總體力求實作四個方向的突破:
其一,擁有突破性的x86處理器能效表現;
其二,更加出色的核心效能表現;
其三,更為優異的GPU圖形效能表現;
其四,更加優秀的AI計算能力。
為了實作這四個設計目標,首先,Lunar Lake在每瓦效能的提升上著實是下了很大功夫,這使得新平台總體功耗下降了50%。同時增強和整合了新的電源管理方案,透過全新的供電架構帶來了更好的電源控制,提升了電源利用率。而且記憶體改用芯片封裝之後,PHY功耗降低了40%,再加上改進後的能效核集群,Lunar Lake在功耗方面實作了多項關鍵創新。這部份我們也將透過理論和實際續航測試予以展現。
其次,Lunar Lake放棄了超執行緒設計,並將最佳化重點放在了Lion Cove效能核,以及Skymont能效核上。在關閉超執行緒之後,Lunar Lake效能功耗比提升15%,效能面積比提升10%,效能功耗面積比提升30%。同時,Lunar Lake采用了低延遲結構設計,能效核延遲大約在23ns左右,效能核間延遲大約在26ns左右,能效核到效能核間延遲大約為55ns,記憶體延遲控制在了90ns附近,相比Meteor Lake降低了40%!此外,其能效核代際間IPC提升振幅達到68%,效能核IPC提升14%,每執行緒效能相比前代提升3倍。
其三,Lunar Lake引入了全新Xe2架構GPU,相比Meteor Lake而言,圖形效能提升1.5倍,並且提供了更大的光追單元。其圖形效能提升主要源於Xe核心最高增加到了8個,圖形效能直接強化。
其四,AI效能的提升來源於兩個層面,一方面是GPU AI算力提升,這源於Xe矩陣擴充套件引擎規格的升級。其全新的向量引擎支持4096OPS/clock和2048OPS/clock的INT8和FP16計算,並且改進了固定功能單元,提高了吞吐量,從而最佳化了AI計算效率。其總體AI算力達到了67TOPS,並且擁有8MB L2緩存。另一方面是NPU算力升級,NPU4架構帶來了48TOPS的峰值AI算力,相比上一代10TOPS的算力提升4.8倍。
·Strix Point架構特性簡介
再來看Strix Point。
今年6月份的台北電腦展上,AMD也釋出了新一代移動級處理器平台,即AMD銳龍AI 300系列處理器。全新的銳龍AI 300系列的CPU、NPU以及GPU同樣是全方位升級:
首先,基於XDNA 2架構打造的全新NPU,其算力提升到了最高55TOPS,而現役的8040系列算力僅為16TOPS,同時在能效表現上更加出色。
其次,基於Zen 5架構設計的CPU核心數量最高達到了12核24執行緒,多執行緒效能進一步提升。
其三,基於RDNA 3.5架構打造的iGPU,其計算單元提升到16個,圖形效能進一步增強。同時RDNA3.5架構打造的新一代iGPU則帶來了出色的每瓦效能表現,時脈的增加、33%的計算單元增加帶來了實打實的圖形效能升級,在應對渲染、AI計算、浮點計算時能夠提供更加出色的效能體驗。
此外,銳龍AI 300系列針對AI方面的一項重要升級是支持Block FP16混合數據類別。我們都知道,不同數據類別在效能以及數據準確性方面的表現也不同。傳統層面來看,8-bit INT8數據類別的特點是效能強但準確性低,而16-bit FP16數據類別的特點是準確性高但效能弱。Block FP16則兼顧8-bit數據的效能與16-bit數據的準確性。目前,AMD已經與超過150家AI賦能的ISV合作夥伴達成深度合作來支持此數據類別,因此能夠為AMD銳龍AI 300系列提供相容性更好、效能體驗更好的各類別AI套用。
·參評機型配置資訊一覽
兩大新平台基本資訊了解之後,我們來看看本次參評機型的基本配置資訊,具體如下:
目前酷睿Ultra 200V和銳龍AI 300系列機型比較少,上市的處理器型號也有限,暫時無法在本次評測文章中全部呈現,不過後續我們會透過天梯圖的形式,逐步將上市機型的測試數據錄入其中,以供大家參考。
本次測試除了上一代的英特爾酷睿Ultra 9、Ultra 7、Ultra 5機型,以及AMD銳龍8040機型之外,還包含了新的酷睿Ultra 7 258V和銳龍AI 9 HX 370的測試數據。下面來看看新老兩代AI PC在基礎效能和AI效能方面的表現。
·CPU單核/多核效能評估
首先我們還是依照慣例先看看兩大陣營新老硬件平台的CPU核心效能,這部份測試主要參考CINEBENCH R23和2024的測試結果。
單核效能方面,英特爾酷睿Ultra 7 258V表現非常出色,聯想YOGA Air 15 Aura AI元啟版搭載的英特爾酷睿Ultra 7 258V在CINEBENCH R23單核效能上跑出了1948分的成績,而AMD銳龍AI 9 HX 370略低一些,單核效能為1941分。華碩靈耀14 Air+這款相對小尺寸的輕薄本上搭載的酷睿Ultra 7 258V也跑出了1933分的成績,比上一代頂級的酷睿Ultra 9 185H都要高出不少,更是全面優於上一代的銳龍8040系列處理器。
CINBENCH 2024單核效能同樣也是酷睿Ultra 7 258V霸榜前兩名,酷睿Ultra 9 185H作為上代旗艦,在小新Pro 16的調校下效能表現也很不錯,而銳龍AI 9 HX 370的表現其實也是相當可以了。
多核效能方面,酷睿Ultra 200V系列因為主打能效,因此取消了超執行緒技術的同時,又縮減了核心數量,所以這方面的表現確實不如核心多、執行緒多的上一代酷睿Ultra處理器以及AMD銳龍平台。CINEBENCH R23多核方面,上一代酷睿Ultra 9 185H獨占鰲頭,得分高達20055,銳龍AI 9 HX 370位居第二,得分17457,另外酷睿Ultra 7 155H的多核效能要優於銳龍8040系列的同級別處理器。
CINEBENCH 2024的測試結果基本相仿,酷睿Ultra 9 185H獨一檔,多核得分1119,位居第二的是Redmi Book Pro 14 2024搭載的酷睿Ultra 7 155H處理器,多核得分1042分。這裏要著重提一下Redmi Book Pro 14 2024這款產品。在上一代AI PC產品中,它是一匹實力不俗的黑馬級產品,效能調校不輸聯想、華碩這樣的傳統PC品牌,而且性價比非常不錯,其效能調校方面說實話是頗為讓人有些意外的。另外銳龍AI 9 HX 370位居第三,多核得分978,相比上一代銳龍8040系列提升也是相當大的。
在CPU效能方面,英特爾酷睿Ultra平台相對銳龍平台依舊有著一定的優勢,單核效能新老平台都要略微優於銳龍平台,但多核效能的比拼上,酷睿Ultra 200V跑分上不及銳龍AI 300系列。這主要是因為酷睿Ultra 200V系列的設計邏輯和產品定位與上一代Meteor Lake有很大不同,新平台更加聚焦於能效比和長續航特性,契合輕薄型筆記電腦的特性。因此基於新老兩代平台打造的AI PC,以不同定位和聚焦點滿足了不同使用者的差異化需求。
·GPU圖形&遊戲效能評估
新老兩代AI PC在整合顯卡的效能上也是差異極大,老一代的酷睿Ultra和銳龍8040系列分別搭載銳炫Xe和Radeon 780M iGPU,新一代的酷睿Ultra 200V和銳龍AI 9 HX 370則分別搭載了銳炫140V和Radeon 890M iGPU,二者在架構方面的差異前面我們已經為大家解讀過了,下面來看看實際的效能表現。
英特爾與AMD的核顯具體到不同的處理器是有一些規格上的差異的,執行單元數量的不同、頻率的不同、OEM產品各自調校的差異都會影響最終跑分,這裏我們直接給出機器型號以及對應的核顯型號,跑分成績為3DMark Time Spy+Fire Strike兩種模式的綜合顯卡分數,具體如下:
從測試不難看出,英特爾酷睿Ultra新老兩代產品的銳炫核顯效能總體強於AMD銳龍新老平台,無論是Time Spy DX12和Fire Strike DX11圖形效能,銳炫Xe和銳炫140V都比各自同代的Radeon 780M和Radeon 890M強上不少,這也是英特爾在推出銳炫核顯之後得以為輕薄本帶來更好遊戲體驗的基礎。
當然,3DMark理論測試分數往往不能作為唯一參考標準,畢竟不同遊戲的實際表現與3DMark理論成績是有出入的。在實際遊戲測試中,我們選擇了【古墓麗影:暗影】和【荒野大鏢客2】兩款。
【古墓麗影:暗影】的測試是在1080p分辨率、DX12、高畫質下進行的,酷睿Ultra 7 258V和酷睿Ultra 9 185H平台的表現最好,平均幀為48fps,接下來是銳龍7 8845H和銳龍AI 9 HX 370平台,平均幀分別為46fps和45fps。
【荒野大鏢客2】測試環境是1080p分辨率、低畫質,銳龍AI 9 HX 370和銳龍7 8845HS兩款機型的表現最好,平均幀數分別為56.86fps、53.2fps和52.7fps。酷睿Ultra 7 258V與上一代酷睿Ultra 7 155H、酷睿Ultra 9 185H的表現相差不大,基本都在50fps附近。
從測試可以看到,英特爾銳炫Xe和銳炫140V核顯在3DMark理論效能方面要優於Radeon 780M和Radeon 890M iGPU,不過在實際遊戲中的表現其實是互有勝負。畢竟遊戲體驗與驅動版本、遊戲自身最佳化相掛鉤,所以只做參考即可。
·記憶體延遲測試
在筆記本記憶體進入DDR5時代之後,記憶體延遲越來越高。雖然對於普通套用沒啥太大影響,使用者也很難感知到,但是對於遊戲、AI等記憶體敏感型套用來說,記憶體延遲就顯得比較重要了。降低記憶體延遲一方面要靠處理器底層架構設計來解決,另一方面其實也與OEM產品自身的設計有關。
英特爾酷睿Ultra 200V平台是著力去進行了降低記憶體延遲的設計,而且效果也不錯。透過AIDA 64記憶體延遲測試可以看到,酷睿Ultra 7 258V兩款機型的延遲分別降到了94.5ns和95.1ns。不過上一代銳龍8040表現比較好的平台可以控制在比較低的水平,但新的銳龍AI 9 HX 370記憶體延遲還是比較高的,達到了131.7ns。
·AI理論與套用效能評估
對於AI PC而言,最重要的自然是AI效能了。目前其實AI效能測試的標準還不夠完整,只有UL Procyon是較早涉足AI Benchmark測試的軟件,另外還有Geekbench也加入了AI測試,不過因為後者加入的時間比較晚,很多老機型沒有具體分數,所以這次評測只放酷睿出近期測試的英特爾酷睿Ultra 7 258V和AMD銳龍AI 9 HX 370處理器的相關跑分,大家做一個參考即可。
從測試結果來看,酷睿Ultra 7 258V的單精度算力評分低於銳龍AI 9 HX 370,但是半精度和量化效能都要高於銳龍AI 9 HX 370,二者整體效能基本持平。
無論是英特爾還是AMD,其硬件平台的CPU、GPU、NPU三大計算核心其實都支持AI計算,但是相對來說CPU的AI算力比較弱,所以我們沒有放入相關測試成績。
NPU的測試目前銳龍平台還不支持,所以先來看看酷睿Ultra兩代產品在NPU算力上的前進演化。參考UL Procyon NPU Float16測試,酷睿Ultra 7 258V得分在960以上,相比上一代平均260分左右的成績提升了3.7倍。
GPU的AI效能是目前能夠被客觀衡量的,而且在很多AI套用中,其實GPU才是主力硬件。參考UL Procyon GPU Float16測試,酷睿Ultra 7 258V搭載的銳炫140V核顯的AI算力達到了870分以上,是上一代的近2倍,是銳龍平台的約2.7倍。另外銳炫核顯的AI效能普遍優於銳龍的Radeon核顯。
接下來看看實際套用方面的表現。
目前的測試方法中,AI套用效能很難有標準化的測試方法,畢竟大模型的種類、數量、是否針對特定加速器有最佳化等情況是相當復雜的,所以我們認為設定了Stable Diffusion預設的anything v5模型,這個模型基本不支持任何硬件平台的加速,這樣可以拋開加速器的幹擾。文生圖與圖生圖設定也盡量剔除人為幹預,文生圖使用預設的512×512,單張,叠代20步的設定,采樣器為預設。
總之一句話,只認為設定測試平台,不人為幹預測試環境和具體選項,總體結果如下:
因為是以秒為單位,所以條形柱越短效能體驗越好。可以看到酷睿Ultra 9 185H的表現非常優秀,文生圖+圖生圖總時間為159秒,接下來是酷睿Ultra 7 258V,總時間為192秒左右,AMD銳龍AI 300和銳龍8040平台的耗時都要更長一些,相對快一些的銳龍AI 9 HX 370平台也達到了261秒。所以在非獨顯環境的文生圖、圖生圖套用上,英特爾平台是有比較明顯的優勢的。
當然如果在實際套用中選擇對應平台的加速器和最佳化過的大模型,整體效率會顯著提升,一般512×512單張圖生成時間不會超過10秒。
·PCMark 10辦公續航能力評估
AI PC因為大都是輕薄本,所以其在實際套用中也往往扮演著商務辦公本的角色。以往x86 Windows平台的最大短板就是續航,被MacBook或高通驍龍這些ARM平台筆記本吊打,但現在,得益於英特爾酷睿Ultra 200V平台,x86 Windows本也有非常不錯的續航能力了。
PCMark 10辦公續航測試中,50%螢幕亮度、60Hz重新整理率、30%音量、Wi-Fi/藍芽開啟狀態下,酷睿Ultra 7 258V平台的兩款機型續航時間都達到22小時以上。而老平台續航表現最好的是Redmi Book Pro 14 2024,成績為902分鐘。其實銳龍AI 9 HX 370相對銳龍8040系列,在續航方面也有顯著提升,達到了800分鐘,也就是13.3小時。
此外需要說明的是,PCMark 10理論續航測試與實際使用時間差異是比較大的,酷睿Ultra 7 258V平台實際辦公套用續航大概在11小時以上,B站4K影片連續播放時間大概在6小時左右。相應的上一代酷睿Ultra平台和銳龍AI 300、銳龍8040平台,實際續航能力也都有不同程度的縮水,畢竟影響續航能力的因素太多,誰都無法給出確切表現,只能作為參考數據。
·評測總結
對於當下的AI PC市場而言,即便酷睿Ultra 200V和銳龍AI 300系列新平台上市,其實上一代的酷睿Ultra和銳龍8040平台產品依舊會延續一定的生命周期。從測試來看,我們可以得出以下幾個結論:
其一,英特爾酷睿Ultra 200V在單核效能、AI效能、圖形效能、續航表現方面非常出色,但是多核效能是其短板。
其二,AMD銳龍AI 300系列處理器在多核效能、實際遊戲效能、能效比方面的表現不錯,但是AI效能、續航能力相對偏弱一些。
其三,上一代的酷睿Ultra平台裏,Ultra 9 185H可以說是當之無愧的旗艦級核心,即便放在新一代產品裏也依然能打。而銳龍8040系列則更加均衡,銳龍7 8845H和8845HS平台依舊是目前主打高性價比產品的首選平台,這對於預算不多的朋友來說非常適合。