當前位置: 華文世界 > 科技

PC的「超大核顯」時代,我們是否已準備好

2024-07-17科技

不久前,在我們三易生活在分析AMD技術日所公布的產品資訊時就曾經指出,AMD在最新的GPU和NPU設計裏,似乎還埋了一些「伏筆」。

當時我們所指的資訊,主要有兩個方面。其一是AMD大篇幅地宣傳XDNA2在他們AI體系中的作用,但絕口未提如今RDNA3獨顯裏所整合的AI單元設計。這可能是在暗示他們將在未來的消費級顯卡裏也全面整合XDNA單元作為AI加速器,而不再使用現有的、由顯卡團隊設計的AI單元。(當然這也可能意味著,對現有顯卡AI單元的潛力挖掘和功能適配工作會受到影響)。

其二就是我們註意到,AMD方面在介紹RDNA3.5核顯的變化時,專門講到它提升了記憶體效率,降低了GPU對於記憶體頻寬的依賴度。而這似乎便是在暗示那已傳聞許久,PC史上第二款x86架構的「超大核顯」設計Strix Halo APU。

16核CPU+超大NPU,還有比獨顯更強的核顯

Stirx Halo有多強?就在前不久,多款基於這款處理器的測試平台資訊被曝光。根據這些資訊可以推測,一款典型的Stirx Halo擁有兩個8核心Zen5 CPU模組、最高主頻5.8GHz,並整合了高達64MB的三級緩存。與此同時,它還擁有算力達到70TOPs級別的NPU。

當然,Stirx Halo最引人註目的地方還是在於,它還擁有一顆堪稱恐怖的40CU RDNA3.5核顯。稍作計算就會發現,這意味著這顆GPU具備2560個流處理器、160個紋理單元、80個光柵單元,以及40個光追單元。換句話說,它的硬件規模甚至超過了現在的Radeon RX7700S獨顯。

更進一步來說,如果假設Stirx Halo的核顯執行頻率與它的同代次「小弟」、也就是Radeon 890M相仿,那麽這顆40CU的巨大核顯將會擁有恐怖的29.7TFlops單精度算力,以及232GP/s的像素填充率和348GT/s的紋理填充率。

這是什麽概念呢?如果只比較單精度算力的話,Stirx Halo甚至已經可以比肩隔壁RTX4090的Max-Q版本,或者說與桌面版的RTX4070 Super差不多了。

大CPU大GPU的記憶體搶占問題,註定不容忽視

當然,以往的經驗告訴我們,看起來很高的硬件規格並不總是意味著實際很好的效能表現。特別是對於CPU和GPU整合在一起的芯片來說,當兩者的規格都很「大」的時候,相互之間的記憶體頻寬搶占可能就會變成一個不容忽視的問題。

當然,AMD方面不可能沒有想到這個問題。按照目前流傳的說法,Stirx Halo將會擁有32MB、由CPU和GPU共用的四級緩存,以減輕對記憶體頻寬的壓力。

更為重要的是,Stirx Halo很可能會是x86架構移動處理器中首個使用256bit統一記憶體的設計。據目前已曝光的測試平台來看,它的記憶體容量或將從32GB起步,最高提供128GB、甚至256GB可選。

假設Strix Halo的CPU記憶體控制器體質與目前已經釋出的銳龍AI流動平台相仿,那麽這就意味著它將支持256bit的LPDDR5X記憶體、從而提供240GB/s的記憶體頻寬。

乍看之下,這個記憶體頻寬似乎已經非常大,甚至比執行緒撕裂者7000X系列的記憶體頻寬還要高了近50%。但如果考慮到GPU的視訊記憶體池頻寬需求,那麽它實際上可能只能算是「勉強夠用」。因為類比就會發現,桌面端比它流處理器數量少20%的Radeon RX7600,其所標配的視訊記憶體頻寬都已高達288GB/s,而且這還是真正的獨立視訊記憶體,並不需要與CPU共享頻寬。

特殊的產品定位,或是Strix Halo的破局之道

那麽這是否意味著Strix Halo的「超大核顯」,效能就會不盡如人意呢?其實也不見得。

高TDP的單芯片PC方案有沒有覺得很眼熟?其實當年Intel也做過類似的產品

從目前的已知資訊來看,Strix Halo這顆「超級APU」的產品定位會非常、非常高。據稱其單芯片TDP高達120W以上,而且會標配超大記憶體,主打的就是「移動生成式AI工作站」。

DELL曾基於Intel KabyLake-G平台推出了翻轉屏筆記本工作站

於是在這樣的產品定位下,一方面只要Strix Halo的單芯片功耗低於常規的標壓CPU+移動獨顯方案,那麽它反而有望實作一些大尺寸、但非常輕薄的筆記本工作站產品形態,而且帶來比潛在的獨顯競品更長的續航能力。

一款出廠搭配5600MHz記憶體的12代酷睿輕薄本,證明高價產品的確可能會有額外的效能設計

從另一方面來說,考慮到Stirx Halo的定位,顯然也不能排除AMD(或相關PC廠商)屆時為其搭配更高頻率記憶體顆粒,從而額外增加記憶體頻寬的可能性,畢竟類似的情況我們三易生活就已經見識過。可以說只要產品定位夠高、定價夠貴,廠商就確實會有動機去額外「加料」,當然反之亦然。

最後、也是最重要的,就是雖然當Strix Halo真正登場時,它可能會是x86架構裏唯一在售,采用「超大核顯」、以及大頻寬統一記憶體設計的PC工作站芯片方案。但縱觀整個業界,無論蘋果的M系芯片、還是高通的驍龍X系列,實際上都相當於已經替它開辟了道路,至少讓相關開發者在面對這種「大U大顯」的特殊PC芯片做最佳化時,並不太可能會無所適從。

況且如果Stirx Halo明確定位於「AI工作站芯片」,那麽這也就意味著,它並不見得會與那些獨顯遊戲本構成直接競爭。再考慮到AI創作任務對於GPU視訊記憶體的特殊需求(容量遠比頻寬重要),以及屆時業內可能比現在更成熟的套用最佳化環境,這款看起來非常夢幻的超大型APU芯片,屆時確實可能會有其獨特的市場競爭力。

至於說它的誕生是否會引領PC芯片更大規模地轉向「整合化」,甚至於讓統一記憶體的理念也浸染更多x86架構產品,目前可能還不太好說。

【本文圖片來自網絡】