GDDR 7，正式釋出

2024-03-08數碼

據 BusinessWire 報道，JEDEC 已釋出 GDDR7 記憶體標準規範。下一代記憶體將用於顯卡，AMD、美光、Nvidia、三星和SK海力士都參與了此事。我們預計 GDDR7 將成為高端 RDNA 4 和 Blackwell GPU 的首選記憶體，據傳它們將於明年推出，並在我們的最佳顯卡排行榜上爭奪一席之地。

自第一款顯卡開始支持 GDDR6 記憶體以來，已經過去了近六年的時間。這就是 Nvidia 於 2018 年 9 月推出的 RTX 20 系列圖靈架構。首款采用 GDDR6 的RTX 2080和RTX 2080 Ti GPU 的記憶體時脈為 14 Gbps (14 GT/s)，每台器材可提供 56 GB/s 的速度。後來的解決方案（例如 AMD 的RX 7900 XTX）的時鐘速度高達 20 Gbps，速度為 80 GB/s。

Nvidia 幫助建立了更快的 GDDR6X 替代方案，在RTX 3080中的速度為 19 Gbps，最終在最新的RTX 4080 Super中高達 23 Gbps 。按照官方說法，美光 GDDR6X 芯片的速率高達 24 Gbps，每台器材的速率可達 96 GB/s。

GDDR7 將大幅增加頻寬。JEDEC 的規格最終將達到每台器材 192 GB/s。計算得出，記憶體速度為 48 Gbps，是最快 GDDR6X 的兩倍。然而，它達到該速度的方式與之前的記憶體解決方案不同。

GDDR7 將使用三個級別的信令（-1、0、+1）每兩個周期傳輸三位數據。這是 GDDR6 中使用的 NRZ（不歸零）訊號的變化，GDDR6 在兩個周期內傳輸兩位。僅這一變化就使數據傳輸效率提高了 50%，這意味著基礎時鐘不必是 GDDR6 的兩倍。

其他變化包括使用獨立於核心的線性反饋移位寄存器訓練模式來提高準確性並減少訓練時間。GDDR7 的獨立通道數量將增加一倍（GDDR6 為 4 個，而 GDDR6 為 2 個），並且將使用 PAM3 信令。

這些都不是新資訊，三星去年 7 月透露了許多關鍵的 GDDR7 細節。然而，JEDEC 標準的釋出標誌著一個重要的裏程碑，並表明 GDDR7 解決方案的公開可用性和使用迫在眉睫（相對而言）。

Nvidia 的下一代 Blackwell 架構預計在推出時將使用 GDDR7。我們可能會在 2024 年末推出 Blackwell 的數據中心版本，但它將使用 HBM3E 記憶體而不是 GDDR7。消費級產品很可能會在 2025 年初上市，並且像往常一樣，這些部件將會有專業版和數據中心版。AMD 也在開發 RDNA 4，我們預計它也將使用 GDDR7——不過，如果兩家公司的低端部件出於成本原因仍然選擇堅持使用 GDDR6，也不要感到驚訝。

無論哪種情況，AMD 或 Nvidia 在最高速度下使用 GDDR7 都可能使用當今最寬的 384 位介面提供高達 2,304 GB/s 的頻寬。我們真的會看到這樣的頻寬嗎？也許不是，例如 Nvidia 的 RTX 40 系列 GPU（配備 GDDR6X）都使用略低於最大時鐘的時鐘。盡管如此，我們仍然可以輕松地看到即將推出的架構的頻寬翻倍。

這些什麽時候才能真正到達？我們不排除在 2024 年末推出的可能性。Nvidia 的 RTX 30 系列於 2020 年秋季推出，RTX 40 系列於 2022 年秋季推出。AMD 的 RX 6000 系列同樣於 2020 年底推出，RX 7000 系列於 2022 年底推出。如果保持同樣的兩年節奏，我們可以在年底前看到 GDDR7 顯卡。但不要抱太大希望，因為我們仍然認為 2025 年初的可能性更大。

JEDEC 釋出 GDDR7 圖形記憶體標準

微電子行業標準制定的全球領導者JEDEC固態技術協會很高興地宣布釋出JESD239圖形雙倍數據速率(GDDR7) SGRAM。JESD239 GDDR7 提供的頻寬是 GDDR6 的兩倍，每台器材的頻寬高達 192 GB/s，可滿足圖形、遊戲、計算、網絡和 AI 套用中對更多記憶體頻寬不斷增長的需求。

JESD239 GDDR7 是首款使用脈沖振幅調制 (PAM) 介面進行高頻操作的 JEDEC 標準 DRAM。其 PAM3 介面提高了高頻操作的訊噪比 (SNR)，同時提高了能效。透過使用 3 個級別（+1、0、-1）在 2 個周期內傳輸 3 位，而不是傳統的 NRZ（不歸零）介面在 2 個周期內傳輸 2 位，PAM3 提供了更高的數據傳輸速率。迴圈，從而提高效能。

其他高級功能包括：

具有眼圖掩蔽和錯誤計數器的核心獨立 LFSR（線性反饋移位寄存器）訓練模式可提高訓練準確性，同時減少訓練時間；
獨立通道數量翻倍，從 GDDR6 中的 2 個增加到 GDDR7 中的 4 個；
支持 16 Gbit 至 32 Gbit 密度，包括支持 2 通道模式以使系統容量加倍；
透過整合最新的數據完整性功能，包括帶即時報告的片上 ECC (ODECC)、數據中毒、錯誤檢查和清理以及帶命令阻塞的命令地址奇偶校驗 (CAPARBLK)，滿足 RAS（可靠性、可用性、可維護性）的市場需求；

JEDEC 董事會主席 Mian Quddus 表示：「JESD239 GDDR7 標誌著高速記憶體設計的重大進步。「隨著向 PAM3 訊號的轉變，記憶體行業有了一條新的途徑來擴充套件 GDDR 器材的效能並推動圖形和各種高效能套用的不斷發展。」

「GDDR7 是首款不僅專註於頻寬，而且透過整合最新的數據完整性功能來滿足 RAS 市場需求的 GDDR，這些功能使 GDDR 器材能夠更好地服務雲遊戲和計算等現有市場，並擴充套件到 AI、 JEDEC GDDR 小組委員會主席 Michael Litt 說道。

AMD 計算和圖形技術長兼企業研究員 Joe Macri 表示：「今天推出的突破性 GDDR7 記憶體標準代表著釋放下一代消費、遊戲、商業和企業器材潛力的關鍵一步。」「透過利用 GDDR7 的變革力量，我們可以共同開啟變革計算和圖形可能性的新時代，為創新和發現塑造的未來鋪平道路。」

「美光在透過 JEDEC 定義圖形 DRAM 標準方面有著悠久的歷史，並且在與我們的合作夥伴和客戶一起推動 GDDR7 標準化活動方面發揮了關鍵作用，」美光計算和網絡部門的首席架構師兼傑出技術人員 Frank Ross 說道。業務單位。「利用多級信令的 GDDR 產品的開發有助於確定滿足未來不斷增長的系統頻寬需求的途徑。透過添加領先的 RAS 功能，GDDR7 標準可滿足遠遠超出傳統圖形市場的工作負載要求。」

NVIDIA GPU 產品管理副總裁 Kaustubh Sanghani 表示：「 NVIDIA很高興我們與 JEDEC 的合作幫助 PAM 訊號成為 GDDR7 的基礎技術，幫助客戶充分發揮 GPU 的效能。」

三星執行副總裁兼記憶體產品規劃主管 YongCheol Bae 表示：「人工智能、高效能計算和高端遊戲需要高效能記憶體來以前所未有的速度處理數據。」「GDDR7 32Gbps 將實作 1.6 倍的效能提升，同時具有最高的可靠性和成本效益。」

「隨著每一代圖形記憶體的出現，業界始終致力於實作同時確保最高速度和提高能效的宏偉目標。SK海力士很榮幸能夠作為JEDEC成員參與GDDR7標準工作，並很高興能夠為客戶提供最高速度和出色功效的記憶體。再次實作標準工作將成為業界擴充套件記憶體生態系的新機遇。」SK海力士產品規劃副總裁Sang Kwon Lee表示。

GDDR7 更多技術細節曝光：

36Gbps與PAM 3編碼

當三星前年10月嘲笑GDDR7 記憶體的持續開發時， Cadence 沒有透露即將推出的規範的任何其他技術細節。但他們最近透露了有關該技術的一些額外細節。事實證明，GDDR7 記憶體將使用 PAM3 和 NRZ 訊號，並將支持許多其他功能，目標是達到每個引腳高達 36 Gbps 的數據速率。

簡短的 GDDR 歷史課

在較高的層面上，近年來 GDDR 記憶體的發展相當簡單：更新的記憶體叠代提高了訊號速率，增加了突發大小（burst size）以跟上這些訊號速率，並提高了通道利用率。但是這些都沒有顯著增加儲存單元的內部時鐘。例如，GDDR5X 和後來的 GDDR6 將其突發大小增加到 16 字節，然後切換到雙鍊結 32 字節存取粒度。雖然每一代技術都面臨著挑戰，但最終行業參與者已經能夠透過每個版本的 GDDR 提高記憶體總線的頻率，以保持效能的提升。

但即使是「簡單」的頻率增加也越來越變得不那麽簡單了。這促使該行業尋找除了加快時鐘之外的解決方案。

借助 GDDR6X，美光和 NVIDIA 將傳統的不歸零 (NRZ/PAM2) 編碼替換為四級脈沖振幅調制 (PAM4) 編碼。PAM4 使用四個訊號電平將有效數據傳輸速率提高到每個周期兩個數據位，從而實作更高的數據傳輸速率。實際上，由於 GDDR6X 在 PAM4 模式下執行時具有 8 字節 (BL8) 的突發長度（burst length），因此在相同數據速率（或者更確切地說，訊號速率）下它並不比 GDDR6 快，而是設計為能夠達到比 GDDR6 可以輕松實作的更高的數據速率。

四級脈沖振幅調制在訊號遺失方面優於 NRZ。對於給定的數據速率，由於 PAM4 需要 NRZ 訊號傳輸波特率的一半，因此產生的訊號損失顯著減少。隨著更高頻率的訊號在透過導線/走線時衰減得更快——而且按照數碼邏輯標準，記憶體走線的距離相對較長——能夠在本質上是較低頻率的總線上執行，最終使一些工程和走線更容易實作更高的數據速率。

權衡（trade-off ）是 PAM4 訊號通常對隨機和感應雜訊更敏感；為了換取較低頻率的訊號，您必須能夠正確辨識兩倍的狀態。實際上，這會導致給定頻率下的誤碼率更高。為了降低BER，需要在Rx端進行均衡，在Tx端進行預補償，這會增加功耗。雖然它未用於 GDDR6X 記憶體，但在更高頻率（例如 PCIe 6.0）下，前向錯誤更正 (FEC) 也是一項實際要求。

當然，GDDR6X 記憶體子系統需要全新的記憶體控制器，以及用於處理器和記憶體芯片的全新物理介面 (PHY)。這些復雜的實作在很大程度上是四級編碼直到最近才幾乎完全用於高端數據中心網絡的主要原因，在這些網絡中有支持使用這種尖端技術的利潤。

GDDR7：PAM3 編碼高達 36 Gbps/pin

考慮到上述在使用 PAM4 訊號或 NRZ 訊號時的權衡，事實證明支持 GDDR7 記憶體標準的 JEDEC 成員反而采取了一些折衷的立場。GDDR7 記憶體設定為使用 PAM3 編碼進行高速傳輸，而不是使用 PAM4。

顧名思義，PAM3 介於 NRZ/PAM2 和 PAM4 之間，使用三級脈沖振幅調制（-1、0、+1）訊號，允許它每個周期傳輸 1.5 位（或者更確切地說是 3 位以上）兩個周期）。PAM3 提供比 NRZ 更高的每周期數據傳輸速率——減少了遷移到更高記憶體總線頻率的需要以及由此帶來的訊號遺失挑戰——同時需要比 PAM4 更寬松的訊噪比。總的來說，GDDR7 承諾比 GDDR6 具有更高的效能，同時比 GDDR6X 具有更低的功耗和實施成本。

對於那些記分的人來說，這實際上是我們看到的第二個使用 PAM3 的主要消費技術。出於類似的技術原因，USB4 v2（又名 80Gbps USB）也在使用 PAM3。那麽 PAM3 到底是什麽？

PAM3 是一種數據線可以承載 -1、0 或 +1 的技術。該系統所做的實際上是將兩個 PAM3 傳輸組合成一個 3 位數據訊號，例如 000 是一個 -1 後跟一個 -1。這變得很復雜，所以這裏有一個表格：

當我們將 NRZ 與 PAM3 和 PAM4 進行比較時，我們可以看到 PAM3 的數據傳輸速率處於 NRZ 和 PAM4 的中間。在這種情況下使用 PAM3 的原因是為了在沒有 PAM4 需要啟用的額外限制的情況下實作更高的頻寬。

話雖如此，三星承諾的具有 36 Gbps 數據傳輸速率的 256 位記憶體子系統將使用多少功率還有待觀察。GDDR7 規範本身尚未獲得批準，硬件本身仍在構建中（這正是 Cadence 等工具發揮作用的地方）。但請記住，AI、HPC 和圖形的頻寬需求量很大，頻寬將永遠受到歡迎。

最佳化效率和功耗

除了提高吞吐量外，GDDR7 有望采用多種方式來最佳化記憶體效率和功耗。特別是，GDDR7 將支持四種不同的讀取時鐘 (RCK) 模式，以便僅在需要時啟用它：

始終執行：始終執行並在睡眠模式下停止；

禁用：停止執行；

Start with RCK Start command：主機可以在讀出數據之前透過發出RCK Start命令來啟動RCK，並在需要時使用RCK Stop命令停止。

Start with Read：當 DRAM 收到任何涉及讀出數據的命令時，RCK 自動開始執行。它可以使用 RCK Stop 命令停止。

此外，GDDR7 記憶體子系統將能夠並列發出兩個獨立的命令。例如，Bank X 可以透過在 CA[2:0] 上發出 Refresh per bank 命令來重新整理，而 Bank Y 可以透過同時在 CA[4:3] 上發出讀取命令來讀取。此外，GDDR7 將支持線性反饋移位寄存器 (LFSR) 數據訓練模式，以確定適當的電壓電平糊時序，以確保一致的數據傳輸。在這種模式下，主機將跟蹤每個單獨的眼睛（連線），這將允許它套用適當的電壓以更好地最佳化功耗。

最後，GDDR7 將能夠根據頻寬需求在 PAM3 編碼和 NRZ 編碼之間切換。在高頻寬場景中，將使用 PAM3，而在低頻寬場景中，記憶體和記憶體控制器可以切換到更節能的 NRZ。

雖然 GDDR7 承諾在不大幅增加功耗的情況下顯著提高效能，但技術觀眾最大的問題可能是新型記憶體何時可用。由於沒有來自 JEDEC 的硬性承諾，因此沒有預計 GDDR7 釋出的具體時間表。但考慮到所涉及的工作和 Cadence 驗證系統的釋出，預計 GDDR7 將與 AMD 和 NVIDIA 的下一代 GPU 一起進入現場並不是沒有道理的。請記住，這兩家公司傾向於以大約兩年的節奏推出新的 GPU 架構，這意味著我們將在 2024 年晚些時候開始看到 GDDR7 出現在器材上。

當然，鑒於如今有如此多的 AI 和 HPC 公司致力於頻寬需求高的產品，其中一兩家可能會更快釋出依賴 GDDR7 視訊記憶體的解決方案。但 GDDR7 的大規模采用幾乎肯定會與 AMD 和 NVIDIA 的下一代圖形卡的量產同時發生。