當前位置: 華文世界 > 遊戲

【黑神話:悟空】揭了GPU的老底

2024-08-30遊戲

【黑神話:悟空】已橫空出世,大家都玩上了嗎?電腦還能帶動嗎?甚至有玩家曬出因為玩【黑神話:悟空】導致電腦主機被燒毀的視訊。

【黑神話:悟空】是一款以中國神話為背景的動作角色扮演遊戲。故事取材於中國古典小說「四大名著」之一的【西遊記】。在遊戲中,玩家將扮演一位「天命人」,為了探尋昔日傳說的真相,踏上一條充滿危險與驚奇的西遊之路。

【黑神話:悟空】在8月20日上市後持續引爆市場。有數據顯示,【黑神話:悟空】在Steam遊戲平台上已售出超過300萬份,加上Epic遊戲商城、騰訊WeGame和索尼PlayStation平台,總銷量超過450萬份,總銷售額超過15億元人民幣,創下多個國產遊戲銷售紀錄。
官方數據顯示,截止到2024年8月23日21點整,【黑神話:悟空】全平台銷量已超過1000萬套。而高盛集團預測,樂觀情況下,該遊戲可能售出2000萬份,收入超過50億元人民幣。

【黑神話:悟空】也是中國首款3A遊戲,這意味著該遊戲在高成本、高體量、高品質方面十分突出。該遊戲對執行的硬體配置提出了一定的要求,特別是遊戲宣傳支持全景光線追蹤(輝達稱之為路徑追蹤)、全分辨率多次彈射光線追蹤間接照明、全分辨率光線追蹤反射、光線追蹤粒子反射、光線追蹤焦散以及光線追蹤陰影。這些技術的套用顯著提升了遊戲中的光照效果、特效表現和整體沈浸感,使之成為目前市場上最具技術先進性和沈浸感的遊戲之一。

一場視覺盛宴

【黑神話:悟空】適用於PC電腦和主機玩家,但如果玩家想在圖形表現上體驗到遊戲的全部魅力,最好使用輝達GPU顯卡。該遊戲支持全景光線追蹤,但正如預期的那樣,這對顯卡的需求超高。不過,即使沒有輝達RTX GPU或光線追蹤模式,遊戲在純光柵化(Rasterization)模式下也非常美觀。在【黑神話:悟空】品質方面,【PC Gamer】為該遊戲給打出了87分的成績,可以作為3A大作的評價參考。

測試人員更感興趣的是【黑神話:悟空】在一些頂級顯卡上的執行情況,並對最新一代的輝達、AMD和英特爾顯卡進行測試,看看它們的表現如何。還有一款獨立的【黑神話:悟空】基準測試工具,它使用與主遊戲相同的內建基準測試,這對效能檢查很有幫助。

令人驚喜的是,【黑神話:悟空】遊戲全面支持各類技術,包括DLSS 3.7.1升級版和(frame generation)幀生成,FSR 3.1升級版和幀生成,以及XeSS 1.3升級版功能。然而,FSR似乎仍存在一些渲染問題,相比於DLSS,其重影和偽影更多。本文中選擇在所有情況下使用67%的縮放比例進行測試,測試人員表示,這能比原生分辨率提供更高的效能,盡管偶爾會出現影像解析度的損失。

為了初步了解【黑神話:悟空】在PC電腦上的執行情況,測試人員使用了標準的顯卡測試電腦,該配置包括英特爾酷睿i9-13900K Raptor Lake處理器、32GB DDR5-6400記憶體和4TB英睿達T700 PCIe 5.0固態硬碟儲存。然後,測試人員使用各公司最新的驅動程式對當前一代的AMD、輝達和英特爾顯卡進行了測試,包括使用輝達560.87驅動預覽版——很明顯這是輝達推薦的遊戲——其遊戲最佳化與公開版560.94驅動相同。還使用AMD 24.7.1和英特爾5971驅動程式,盡管AMD的驅動程式並非是為【黑神話:悟空】特別準備的。

測試人員並沒有測試所有當前一代的顯卡,而是跳過輝達RTX 4080和RTX 4070 Ti,選擇測試它們的super版本。

測試人員在1080p分辨率下使用中畫質預設進行測試,再次手動將縮放比例調整為67%——結束選單後,遊戲總是會將該比例降到66%(如果是從66%開始,則會降到65%,供參考)。測試人員還在1080p、1440p和4K分辨率下使用「影視級畫質」預設進行了測試,同樣將縮放比例手動調整為67%。幾乎所有的測試都是在未啟用幀生成的情況下進行的,因為該功能更像是行銷手段,而不是能夠真正提升整體遊戲體驗的東西,但仍然有使用圖表展示了在啟用幀生成模式下遊戲的執行情況。

本次基準測試是在純光柵化模式(使用虛幻引擎的全域光照系統)下執行的,原因顯而易見。然後使用相同的設定,只是將「全景光線追蹤」開啟,並結合中畫質、使用低光線追蹤預設,然後在1080p、1440p和4K分辨率下使用「影視級畫質」預設和超高的光線追蹤設定。測試人員還以最高1080p設定並啟用幀生成作為最終數據點,以了解這將如何影響「效能」或者至少是影響到顯視器上的生成幀數量。

全景光線追蹤在低等和中等選項設定下對視覺效果的提升有限,而在非輝達顯卡上,開啟「超高」選項則會大幅降低效能。它確實提升了遊戲的視覺效果,增加了許多細節,但這主要是為那些至少擁有輝達RTX 4070或更高級別顯卡的玩家所設計的功能。

中畫質 顯卡表現

首先來看一下光柵化的效能表現。每個設定至少執行兩次,取較高的結果;第一次測試(即啟動遊戲後)執行三次,並舍棄第一次結果。內建的基準測試大約持續145秒,要測試每個顯卡上的多達九種不同設定需要花費大量時間。

測試人員從中畫質預設開始,這提供了視覺保真度和效能的良好平衡。虛幻引擎的Lumen和Nanite技術得到了很好的套用,盡管將Lumen歸類為「軟體光線追蹤」有點勉強——更準確地說,它是「基於著色器的渲染,帶有一些近似光線追蹤的計算」,這基本上就是人們所認為的「光柵化」的含義。該技術的某些元素可能可以算作輕量級光線追蹤,但例如在反射方面,它使用的仍然是傳統的SSR(螢幕空間反射)。

還有一點要提的是,遊戲在所有設定下預設使用超采樣(Upscaling)。它使用一個範圍從25到100的滾軸,代表16倍超采樣。它會在1080p時將比例設定為66%,在1440p時為50%,而在4K時則為44%(1600x900分辨率下預設是80%——只有720p預設是100%縮放)。

如果玩家習慣了標準的畫質、平衡和效能放大模式,那麽【黑神話:悟空】所使用的值通常更為激進。品質模式通常意味著約2倍放大,或者目標分辨率的約71%;平衡模式使用約3倍放大,或58%的縮放;效能模式使用約4倍放大,或目標分辨率的50%。(DLSS、FSR和XeSS也可以根據遊戲和版本使用略有不同的值,但這裏不打算深入探討這些細節。)

為了實作目的,測試人員不想依賴於不同的縮放值,所以為所有測試設定了靜態的67%縮放。這意味著在1080p輸出時為1280x720渲染分辨率,1440p輸出時為1707x960渲染分辨率,而4K輸出時為2560x1440渲染分辨率。如果使用遊戲的預設值,那麽1080p和1440p輸出的渲染分辨率將分別為1280x720、1280x720,而4K時為1707x960——這意味著1080p和1440p的結果會非常相似,除了在放大過程中產生的額外開銷。如果玩家喜歡更低的幀率,以原生分辨率在最高級設定下執行遊戲是進一步降低效能的好方法。

測試人員表示,對效能的初步觀察總體上相當不錯。測試的幾乎所有內容都輕松超過60fps。當然,較老一代的顯卡更有可能遇到困難,這將在不久的將來進行嘗試測試,但玩家只需要一張預算200美元的顯卡就可以在【黑神話:悟空】中獲得良好的體驗。

AMD與輝達的結果也相當合理。通常情況下,輝達RTX 4080 Super略微領先AMD RX 7900 XTX,AMD RX 7900 XT通常與RTX 4070 Ti Super接近。一些較低端的AMD顯卡表現得並不那麽好。顯卡效能排行榜顯示,在光柵化效能方面,AMD RX 7700 XT比輝達RTX 4060 Ti快16%;而在這裏,它只快了4%。同樣,AMD RX 7800 XT在通常情況下比輝達 RTX 4070快6%,但在這裏卻慢了1%。

【黑神話:悟空】一直由輝達大力推廣也說明了一定的問題。盡管虛幻引擎5本身應該在一定程度上與顯卡無關,但開發者需要為他們特定的遊戲進行調優,這可能導致廠商帶來特定的最佳化。

那麽英特爾Arc銳炫顯示表現如何?盡管有為該遊戲準備的驅動程式,但它實際上仍屬於較老一代的硬體——其設計目標是與輝達RTX 3060競爭,並且在驅動程式不拖後腿的情況下基本可以做到這一點。它在光柵化遊戲中往往表現不如AMD的「同等」產品,但在光線追蹤方面表現更好。

英特爾Arc A770 16GB和A750是迄今為止測試的最慢的兩款顯卡,Arc A770剛好超過60fps,而Arc A750只達到52fps。A770還比A750有14%的原始計算能力以及更多的記憶體,因此比A750的效能高出20%並不完全出乎意料——只是比通常看到的差距更大。英特爾顯卡的最低幀數也較低,這表明進一步的驅動程式最佳化可能會有幫助。不過,這些結果並不令人意外,因為在顯卡效能排行榜中,英特爾Arc A770和A750也排在AMD RX 7600之下。

影視級 畫質顯卡效能

在討論「影視級畫質」預設的結果之前,需要明確一點:本次測試並不是在尋找不同顯卡的最佳設定組合。目的是展示顯卡在效能潛力上的表現,因此測試人員選擇使用最高級設定來測試這些顯卡。

如果玩家只是想玩【黑神話:悟空】,高畫質預設通常比影視級畫質預設執行速度快約50%~60%,因此推薦大多數使用者使用此設定。稍後會討論不同預設和影像解析度的問題,但超過高畫質預設的提升效果非常有限。

使用影視級畫質預設會導致效能大幅下降,這也是為什麽遊戲預設開啟超采樣的原因。本次測試的所有顯卡在影視級畫質預設下的效能都下降一半或更多,相比於中畫質預設。盡管大多數情況下仍然可以勉強執行,但在這些設定下,玩家至少需要一款輝達RTX 4070 Super才能穩定在60fps以上執行遊戲。

與之前一樣,AMD和輝達的對比在高端產品上看起來相近,但在效能較低的顯卡上,輝達RTX顯卡的表現稍好一些。雖然輝達RTX 4060 Ti的價格可能與AMD RX 7700 XT相當,但在光柵化效能方面,AMD通常占有優勢。

英特爾的Arc顯卡在圖表底部的位置再次出現。英特爾Arc A770僅比AMD RX 7600慢約10%,這與通常在光柵化遊戲中的表現差異相符,但Arc A770的幀率略低於30fps,最低幀率降到十幾fps。其他遊戲中的Arc A750 8GB版表現也不佳,但這在【黑神話:悟空】中似乎不是一個大問題。A770比A750快17%,這與計算每秒萬億次浮點運算的差異基本一致。

由於時間限制,本次沒有對每個顯卡進行高畫質設定測試,但如影像品質分析所示,高畫質設定通常是在影像品質和效能之間的最佳平衡點。如前所述,它比影視級畫質預設快50%~60%,並且總體上看起來幾乎一樣。陰影和植被的微小差異不足以彌補效能上的損失。

在1440p的影視級畫質預設下,效能相比於1080p並沒有大幅下降。這可能是由於啟用了67%的縮放比例。本次測試的GPU在1440p下普遍比在較低分辨率下慢12%~17%。這使得一些顯卡在這些設定下的表現不盡如人意——例如輝達RTX 4060及以下的GPU在這些設定下的表現相對勉強,但透過調整設定,可以使這些顯卡在較低畫質下處理1440p。顯然,還有許多測試過的GPU效能較差,舊顯卡在1440p下表現更差。

與1080p中畫質相比,單獨GPU的排名沒有發生任何變化。這是一個有趣的結果,因為通常會有一些變化。此外,輝達RTX 4060 Ti 16GB和8GB以及AMD RX 7600 XT和普通TX 7600的效能基本相同。顯然,在測試中並沒有超過8GB的視訊記憶體。

在4K的影視級畫質預設下,GPU的排名幾乎沒有變化,只有英特爾Arc A770的位置有所變化。在這些4K結果中,效能下降不像其他遊戲中那麽明顯,這部份是由於超采樣的緣故,因為原生4K渲染通常會增加視訊記憶體的需求。然而,許多其他遊戲超出了8GB視訊記憶體的使用量,因此測試發現AMD RX 7600、輝達RTX 4060和RTX 4060 Ti在4K下仍能維持效能,令人欣慰。

這些顯卡在4K下的表現雖然不能算作流暢,但它們的緩慢並不是由於視訊記憶體分配不足,而是由於遊戲引擎的需求。如果玩家想在4K下獲得至少邊際可玩的效能,至少需要AMD RX 7800 XT或輝達RTX 4070(即使是使用超采樣技術)。

有趣的是,盡管其他8GB顯卡在4K下表現尚可,英特爾Arc A750在這裏的表現卻落後。雖然19fps比11fps高,但兩款Arc顯卡在【黑神話:悟空】中都無法達到4K。正如在下一步全光追測試中所看到的,英特爾的驅動程式似乎需要進一步最佳化以適應這款遊戲。

至於在4K下達到60fps,只有強大的輝達RTX 4090可以做到。這可能會在輝達布Blackwell GPU(如RTX 5080和5090)和AMD RDNA 4顯卡釋出後有所改進,但這些產品至少要幾個月後才會出現。

如上所述,高畫質設定可以提高大約50~60%的效能,在某些情況下可能更多。這將使輝達RTX 4060 Ti及以上的顯卡在4K下變得可行,甚至在緊急情況下,輝達RTX 4060和AMD RX 7600也可能應對得當。

全景 光線追蹤 效能

如果影視級畫質測試的結果有時看起來相當糟糕,請等到啟用全景光線追蹤後看看會發生什麽。在這裏,效能成唯一關註點。

使用中畫質設定進行測試,將全景光線追蹤設定為低等,作為「簡單光線追蹤」選項,然後使用影視級畫質預設,將全景光線追蹤設定為「超高」,以獲得最高影像品質。

這就涉及到兩種GPU型別的故事:輝達和其他所有GPU。對於RTX 40系列GPU,中等光線追蹤測試執行良好。輝達RTX 4060及以上的所有產品都實作突破60fps(再次強調,這是在沒有使用DLSS 3幀生成情況下實作的)。對於輝達的最新GPU,在這些設定下遊戲絕對可玩。

另一方面是AMD的測試結果,如果是900美元的AMD RX 7900 XTX,其一開始就略低於輝達RTX 4060,而且差距越來越大。考慮到AMD RX 7900 XTX在光柵化結果中的表現非常接近輝達RTX 4080 Super,但看到其效能下降到不到該水平的一半,意味著大多數AMD使用者甚至不應該啟用全景光線追蹤選項,除非是嘗鮮。

至少AMD RX 7700 XT及以上在技術上是可玩的;RX 7600和7600 XT及以下則表現較差。有趣的是,即使啟用全景光線追蹤,VRAM容量似乎仍然不重要。AMD RX 7600 XT和RX 7600,以及輝達RTX 4060 Ti 16GB和RTX 4060 Ti,基本上提供相同級別的效能。虛幻引擎5可能存在一些缺陷,但【黑神話:悟空】無需大量VRAM即可實作一些令人驚嘆的視覺效果。

除非是玩家擁有英特爾Arc A750(可能還有其他8GB Arc卡)。同樣,Arc A770 16GB提供的效能要高得多,不僅僅是原始計算應提供的效能,其平均fps比A750快33%,但更明顯的是,在1%的低fps上,它幾乎高出兩倍。在啟用全景光線追蹤的初始測試執行後,A750的效能也持續下降,因此驅動程式在這方面還需要做一些工作。

如果回顧「中等光線追蹤」測試結果,就會發現「超高光線追蹤」效能表現確實很差。輝達RTX 4070 Super及以上版本的平均幀率可達60fps或更高,而RTX 4060及以上版本可能仍能以超過30fps速度執行。但AMD目前最快的GPU甚至無法突破30fps,而且情況只會越來越糟。

此外,雖然英特爾Arc A770 16GB表現不錯,幾乎趕上AMD RX 7700 XT,但英特爾Arc A750的效能卻一落千丈。

出於影像品質的原因,使用全景光線追蹤超高的設定,因為它可以穩定樹葉陰影,增加一些漂亮反射,改善整體場景照明,甚至在水面上產生焦散。使用最高光線追蹤的高畫質預設可以獲得基本相同的影像品質,但這不會真正提高效能,因為許多預設渲染選項無論如何都會被光線追蹤覆蓋。

1440p的最高級設定(包括光線追蹤)在輝達RTX 4090上只能達到60fps以上。玩家也可以使用更高級別的超采樣,但如果選擇這種方式,影像保真度會降低。但如果擁有輝達的最頂級顯卡,它仍然可以以舒適的76fps執行。

AMD的GPU現在都低於20fps,這就要求使用較低的畫質設定。但同樣,測試人員註意到VRAM容量並沒有成為【黑神話:悟空】的限制因素。GPU功耗也顯示出這一點,它基本上達到了所有測試顯卡的指定限制。通常,如果達到VRAM容量限制,由於GPU被迫等待數據,功耗會下降很多。

最後但並非不重要的一點(除了幀速率),本次有測試完全最大化設定的4K。輝達RTX 4090平均為44fps,RTX 4080 Super剛剛超過30fps,最低降至20fps多。其他一切顯卡都無法暢玩。換句話說,在具有【黑神話:悟空】這種圖形復雜度的遊戲上,我們距離實作全景光線追蹤和所有花哨的功能還有很長的路要走。

AMD的個位數幀率結果顯然不太理想,測試人員懷疑這是由於光線追蹤硬體效能不足,或是遊戲根本沒有針對AMD硬體進行全景光線追蹤進行任何最佳化。可能兩者都有,只是程度不同。

如果玩家想建立一個4K圖表使其看起來像是可行的選擇,解決方案很簡單。首先,使用更高級別的超采樣—遊戲通常會在4K下使用大約5倍的超采樣系數,開啟幀生成功能。然後玩家可以像輝達一樣實作RTX 4070 Ti Super達到66fps。

幀生成下的1080p最 設定

幀生成是一項備受爭議的功能。有些人將生成的幀稱為「假幀」,其實這也沒有錯。因為沒有額外的使用者輸入采樣,並且增加了幀生成的開銷,所以通常感覺更像是先後退兩步,再前進兩步。

舉一個具體的例子,假設玩家有一款以50fps執行的遊戲,並且希望透過幀生成來改善該結果。在最佳情況下,幀生成會將幀數加倍,以監控高達100fps的速率,同時增加一點延遲。假如是這種工作方式,大家對該技術的寬容度將大得多。

而事實是,如果玩家以50fps執行遊戲,則開啟幀生成功能通常會產生相當大的開銷。與簡單的幀速率翻倍(其中一半是生成的)不同,玩家通常獲得的是感知fps提高約50%。但是使用幀生成的75fps的結果意味著基本fps已降至37.5fps,這會在一開始感覺有些卡鈍。

簡短來說,為了讓幀生成提供不錯的體驗,人們通常希望生成幀速率超過80fps——這意味著使用者輸入取樣率仍為40fps。在某些情況下可能會發生這種情況,但【黑神話:悟空】在4K下以最高全景光線追蹤設定執行往往對大多數GPU要求過高,除非玩家擁有輝達RTX 4080或RTX 4090。

在該方面,測試人員希望至少能獲得一些幀生成有關的效能數據。使用1080p最高畫質設定——即影視級畫質預設具有超高的光線追蹤品質,加上67%的分辨率縮放,然後開啟幀生成:其中輝達RTX顯卡使用DLSS 3,AMD和英特爾顯卡使用FSR3(XeSS目前沒有自己的幀生成風格)。

然後就

出現了一些有趣的結果,比如FSR3幀生成比DLSS3幀生成更能提高幀速率。部份原因可能是AMD GPU在用於測試的全景光線追蹤設定下表現不佳。但以輝達RTX 4070為例,使用幀生成時畫面為77fps,而沒有使用幀生成時畫面為53fps,所以增加了45%。測試結果認為這是可以接受的——從渲染的53fps變為38.5fps,但使用幀生成將其翻倍。

另一方面,AMD RX 7900 XTX從28fps提高到52fps,提升85%。如果以幀生成100fps的結果來看待這種縮放級別,那將是出色的,但幀生成52fps意味著遊戲感覺就像以26fps執行。這是AMD的最佳結果。盡管如此,由於更好的縮放(暫不討論幀生成影像品質,這通常需要更多妥協),AMD RX 7900 XTX和XT最終能夠至少超越RTX 4060的效能。

作為第二個範例,AMD RX 7900 GRE從20.9fps提高到39.3fps,幀速率提高88%,但在啟用幀生成的情況下,低於40fps的體驗並不好,在玩【黑神話:悟空】時會死得更頻繁。雖然不是完全沒法玩,但體驗也不同於非幀生成的40fps。其他AMD GPU也同樣無法使用這些設定提供良好的體驗——幀生成只能做到這麽多了。

當然,如果玩家不使用光線追蹤,或者只有高端輝達RTX 40系列顯卡,可以透過幀生成獲得更高的幀速率。例如,在1080p測試中,輝達RTX 4070 Ti Super、RTX 4080 Super和RTX 4090都突破了理想的100+fps範圍。這三款顯卡的幀速率都提高約45%~50%,因此增益相當一致。基本渲染的fps仍然會下降,但就可玩性而言,還是可以接受的。

其他輝達GPU的體驗並不那麽好。輝達RTX 4070 Super和RTX 4070執行良好,但RTX 4060 Ti及以下型號的幀率低於60fps,這意味著它們可能看起來執行良好,但在使用幀生成情況下,感覺執行速度會低於30fps。

設定和影像品質

玩家已經看到效能差異,輝達在全景光線追蹤效能方面擊敗了競爭對手,但總體而言,光柵化效能相當接近。這些設定在實踐中又會產生多大的差異,玩家可以理解為不需要絕對的全景光線追蹤即可享受該遊戲。

【黑神話:悟空】使用虛幻引擎5,包括Nanite功能,可實作令人難以置信的細節水平。但它還使用基於軟體的Lumen光線追蹤進行照明和其他效果,這肯定不是完美的。或者,玩家可以啟用全景光線追蹤選項,以「修復」Lumen的一些不太理想的渲染方面——閃爍和斑點陰影、破碎(遮擋)的螢幕空間反射以及其他一些方面。Lumen不會在輝達RTX 40系列和AMD RX 7000系列等GPU中利用光線追蹤硬體,但它甚至可以在輝達GTX 1060和AMD RX 580等較舊的DX11級GPU上執行。

Lumen渲染引擎的優缺點開始變得相當知名。它大多數時候看起來都很不錯,使得【黑神話:悟空】看起來很驚艷,但偶爾的卡頓可能是個問題,即使是高端PC硬體也可能不夠。雖然全景光線追蹤照明確實看起來更好,但對於大多數遊戲玩家來說,Lumen看起來已「足夠好」,並且在各種硬體上執行得比全景光線追蹤模式好得多。換句話說,使用軟體近似值進行渲染通常比執行速度明顯較慢的更精確的光線追蹤渲染更可取。

還有一點需要再次提及,這是一款輝達推薦的遊戲。雖然它使用了虛幻引擎5,但目前尚不清楚它針對輝達硬體進行了多少最佳化,尤其是針對全景光線追蹤模式。另一個有趣的訊息是,【黑神話:悟空】當前不支持輝達的DLSS 3.5光線重建技術,這似乎是錯失了良機。DLSS 3.5功能的支持將為遊戲提供明顯更出色的視覺效果,而且通常還具有效能優勢。也許它將在【黑神話:悟空】後續的修補程式中被添加。

測試人員在AMD RX 7900 XTX和輝達RTX 4080 Super上設定了影視級畫質,以1080p和67%縮放率執行(AMD為FSR3,輝達為DLSS3)。這兩款顯卡的光柵化效能大致相同,輝達顯卡的價格略高,但效能也略高。

結果顯示,差異有時似乎很微妙。在某些比較中,顯然可以從光線追蹤照明、陰影和反射中得到一些好處,但AMD和輝達的結果之間也存在明顯差異。

首先,很明顯,DLSS現在提供更清晰的影像。據【黑神話:悟空】開發人員稱,FSR影像品質正在改進中,因此情況應該會隨著時間的推移而改善。目前,FSR超采樣會導致某些區域的細節遺失,並且在檢視光線追蹤結果時,整體模糊變得更加明顯。

將光線追蹤影像與光柵化結果再次進行比較,在每個場景中都會出現一些非常明顯的差異,但變化並不總是明顯有利於光線追蹤——例如在一些序列中,沒有任何反射,陰影和燈光看起來不同,但光線追蹤本身並不優越。不過,這部份是因為這些是靜態照片,而不是動態影像。

光線追蹤效果值得一提的一點是支持基於粒子的反射,而基準測試序列中並未突出這一點。在某些打鬥場景中,添加反射光線看起來非常引人註目,而關閉光線追蹤後玩家會發現它消失了——但還需要使用設定超高的光線追蹤才能獲得這些粒子反射,除非執行的是1080p且FSR超采樣級別更高,否則非輝達顯卡將無法使用。

總體而言,光線追蹤看起來令人印象深刻,看到這樣的遊戲支持該功能真是太酷了,即使它不太適合執行在很多GPU上。至少玩家們可以這樣強調:「這就是全景光線追蹤可以帶來的好處,這也是它現在還遠未成為主流的原因。」如果玩家擁有高端輝達GPU,那麽在啟用全景光線追蹤的情況下,絕對可以獲得不錯的效能,特別是如果願意調整一些設定並使用更高級別的超采樣。

另外值得關註的是,在啟用和不使用光線追蹤的情況下,各種預設在整體影像品質方面如何比較。這裏有五個標準畫質預設:低、中、高、超高和影視級。其中最後兩個絕對是夢想級領域,至少就影像保真度而言,但它們對效能的影響非常真實。但也有三種光線追蹤選項:低等、中等和超高。

玩家可以將這三個光線追蹤選項中的任何一個與每個全域畫質預設一起使用,或者甚至可以選擇自訂十個單獨的設定。不過,除了三個預設級別之外,光線追蹤選項沒有真正的自訂。【黑神話:悟空】使用ReSTIR全域照明來實作其照明效果,並且還支持光線追蹤陰影、反射和焦散。

即使是低畫質預設看起來也相當不錯,證明虛幻引擎5的外觀有多好,盡管最低設定確實在照明、紋理和陰影品質等方面有所妥協——沒有動態陰影,許多應該顯示靜態陰影的區域根本沒有顯示。如果選擇低設定,在遊戲世界中移動時陰影的截止點也非常明顯,植被的數量也會減少很多。

中等設定代表了一種更合理的妥協,很多電腦能夠毫不費力地執行。陰影看起來不錯,有更多的植被,符合對一款要求苛刻的現代遊戲所期望的那樣。

由中畫質等升級到高、超高和影視級畫質預設級別只會顯示相對較小的變化,至少在靜止影像中是這樣。有一件事不是立竿見影的,那就是即使在最高品質下,高分辨率場景的陰影中也存在一些閃爍和斑點。玩家必須體驗動態遊戲,才能看到這多麽令人分心。僅憑這一點就足以讓玩家想要啟用全景光線追蹤選項,因為它基本上完全解決了陰影問題。

但是,低等設定的全景光線追蹤是一個取舍的好例子。陰影看起來更穩定,整體效果更好,但缺乏適當的反射意味著所有水面看起來都很糟糕——水基本上比使用Lumen的低全域預設更糟糕。考慮到陰影問題和水/反射問題之間的選擇,以及效能下降的因素,玩家預計更傾向使用傳統的光柵化(或至少透過Lumen的軟體照明和陰影)方法。

使用中等設定進行全景光線追蹤可顯著改善水的外觀,但即便如此,由於使用分辨率反射減半,它仍然非常模糊,玩家也不會得到光線追蹤焦散或粒子反射。但是,如果考慮到效能下降——光線追蹤設定超高時,輝達RTX 4080 Super幀率會從超40fps下降到剛過30fps——玩家可能會願意忍受這種模糊。

這是對效能的不同看法,使用4K和67%縮放比例以及所有畫質預設,包括高畫質和影視級畫質,並結合三種光線追蹤設定。輝達RTX 4080 Super和AMD RX 7900 XTX的結果,顯示出與無全景光線追蹤的影視級畫質預設相比的相對效能。

在輝達RTX 4080 Super上,基準影視級畫質效能為56fps—代表絕對可以玩,但並不完全流暢。超高畫質的預設可將效能提高18%,突破60fps的閾值,而高畫質預設可帶來57%的提升,並使GPU達到穩定的88fps。中畫質預設比影視級畫質快89%,最後,低畫質預設可提供2.34倍的速度,並使GPU超過120fps。

啟用全景光線追蹤會降低效能,但如果使用高畫質預設執行,則不會降低那麽多。將光線追蹤設定為低時,高畫質預設與影視級畫質預設基本相同,而將光線追蹤設定為中等時,執行速度僅慢5%。光線追蹤達到最大設定時,高畫質預設的效能會降低30%。將影視級畫質設定與光線追蹤一起使用時,效能會下降20%、21%和41%。最後一個選項是將光線追蹤設定為最高,同時啟用幀生成時,高畫質預設下輝達RTX 4080 Super可達到可觀的61fps(感覺上速度只有一半)。

AMD的RX 7900 XTX在檢視光柵化結果時,最初顯示出相對相似的縮放比例,但隨著畫質品質設定的降低,速度會加快。基準4K影視級畫質效能為49fps,降低畫質預設值時,在超高的設定下,相對效能提高18%——與在輝達RTX 4080 Super上看到的改進相同。但隨後,在高畫質下,速度提高63%,在中畫質設定下,速度提高106%,在最低畫質設定下,速度提高2.65倍。有趣的是,AMD的GPU似乎比輝達GPU更能從較低的畫質設定中獲益,開啟全景光線追蹤模式時則會不一樣。

與基準影視級畫質效能相比,光線追蹤低等選項的高畫質預設會導致效能下降59%。光線追蹤中等選擇預設會導致61%的下降,而超高光線追蹤設定會使效能下降80%—例如,AMD RX 7900 XTX的執行速度是影視級畫質的五分之一。GPU從在最大非光線追蹤設定下至少還算合理可玩,變成了完全不夠用。使用光線追蹤模式升級到影視級畫質預設會顯示更大的增量:在低等、中等和超高的全景光線追蹤模式下,效能分別下降65%、67%和82%。並且使用幀生成,使用高畫質加光線追蹤超高選項,則可以降到20fps。

與效能至少有些相似的輝達RTX 4080 Super相比,AMD最快的GPU在所有全景光線追蹤模式下表現都很糟糕。之前已經看到輝達的光線追蹤硬體往往表現更好,而更多的光線(或光線追蹤效果)會擴大差距,但很難確切地說出為什麽具有完整光線追蹤的遊戲會如此失敗。這真的只是硬體問題,還是軟體最佳化不足也起到了一定作用?

【黑神話:悟空】遊戲中的瀑布場景展示了光線追蹤的潛力。全景光線追蹤在最大設定下看起來非常漂亮,當玩家四處移動時,水反射的焦散都會動起來。降到中等選項的全景光線追蹤設定,分辨率反射減半看起來還行,但遠沒有那麽令人印象深刻,而低等光線追蹤設定看起來比Lumen渲染的水更差。

無論它如何執行,【黑神話:悟空】中的光線追蹤選項確實讓人感覺要麽拉高到最大設定,要麽關閉光線追蹤。問題在於,超高的光線追蹤設定需要同樣高端的輝達GPU。基本上,玩家需要輝達RTX 3080或RTX 4070或更高版本才能在1080p下開啟畫質模式超采樣和最大光線追蹤設定,甚至無法達到穩定的60fps;AMD的頂級GPU甚至無法達到穩定的30fps。

毋庸置疑,在如此低的基礎幀速率下生成幀感覺很一般,我們完全不相信輝達聲稱使用生成幀時可能會顯示的效能提升。使用生成幀的60fps實際上在使用者輸入采樣時以30fps執行,並將該值加倍,因此當出現故障並且生成幀速率下降到40fps時,這意味著使用者會感覺到它大幅下降到20fps,並且任何低於30fps的情況都會被視為嚴重卡頓。此外,測試表明,如果效能太低,幀生成(包括DLSS和FSR)就會開始出現故障,因為渲染幀之間的差異可能會變得太大。在【黑神話:悟空】中,使用幀生成的50~60fps通常可以玩,但不使用幀生成的25~30fps也可以玩,只是體驗不太好。

因此,對於當前的AMD GPU,測試人員建議不要啟用全景光線追蹤選項,除非驅動程式或遊戲更新改善了這種情況。在任何AMD RDNA 3硬體上,在超高的設定下全景光線追蹤都是不可行的,更不用說RDNA 2了。或者至少,在【黑神話:悟空】中啟用全景光線追蹤的方式在AMD上是不可行的,盡管可能還有更好的執行方式。在使用超高的光線追蹤設定和影視級畫質預設時,即使是AMD RX 7900 XTX上1080p的超采樣也會降至30fps以下,因此即使降到全景光線追蹤的高畫質預設也可能只能達到30fps。

總結

作為一款遊戲,【黑神話:悟空】看起來很棒,但更高的設定絕對需要一張效能強大的顯卡。1080p中等分辨率加上超采樣後在低規格GPU上執行良好,在AMD RX 6650 XT上輕松突破60 fps,但影視級畫質「超高」設定會導致要求大幅增加,效能下降一半以上。如果玩家不太擔心錯過一些視覺附加功能,中高畫質預設應該足夠了。

超高設定下的全景光線追蹤,這才是我們真正想要的全景光線追蹤,基本上需要輝達的頂級GPU。AMD的RX 7900 XTX在中低選項的光線追蹤測試中實作超過60fps的速度,但水看起來不如標準Lumen渲染德好。然而,在最大光線追蹤設定下,效能下降到只有28fps,表明無法暢玩。輝達RTX 4080 Super的效能提高了一倍多,在1440p分辨率下仍可暢玩,甚至在4K下也還可以。

目前尚不清楚非輝達顯卡上全景光線追蹤模式的糟糕效能有多少源於這些GPU缺乏光線追蹤能力,又有多少是因為遊戲針對輝達品牌的光線追蹤硬體進行了高度最佳化。如果想使用輝達的方式來執行全景光線追蹤,那麽條件將非常苛刻。遊戲是否可以更好地最佳化以在AMD品牌的光線追蹤硬體上執行?幾乎可以肯定。然而,這可能只會實作兩位數百分比增長,而不會是效能翻倍或三倍以縮小與輝達GPU的差距。

本次沒有進行CPU測試,但測試者可能會在未來將這款遊戲(不包含光線追蹤)加入到CPU測試套件中。系統需求表明,該遊戲實際上並不需要超過6核心的CPU,頂配預計8核心,因為沒有列出高於英特爾酷睿i7-9700或AMD Ryzen 5 5500的CPU。GPU建議要高得多,正如測試人員所展示的效能測試結果那樣。

【黑神話:悟空】的玩家評價非常積極,它融合了古怪而視覺上有趣的Boss和其他敵人,使其脫穎而出。中國的神話也增添了吸重力和趣味性。

在完成所有這些初步測試之後,測試人員一如既往地建議,如果玩家沒有頂級GPU,不要過於糾結追求最高的圖形設定。中高畫質(無全景光線追蹤)應該在大多數不錯的遊戲PC上都可以實作,而且額外的視覺效果並不能帶來更好的遊戲體驗。不過,如果玩家擁有高端輝達RTX 40系列GPU,那麽在遊戲的許多區域,使用粒子反射系統和焦散的全景光線追蹤將帶來令人印象深刻的體驗。