當前位置: 華文世界 > 科技

HPE推出面向HPC及AI用例的經濟高效型儲存系統

2024-05-07科技

HPE為入門級與中端HPC及AI計算集群,專門打造了小型ClusterStor超級電腦儲存陣列。

ClusterStor系列屬於HPE在2019年收購Cray時獲得的資產,采用SSD加HDD以及Lustre檔案系統軟體的並列架構。其中XE E1000型可跨越數百個機架提供60 TB至數十PB的儲存容量,每機架最高容量可達6.8 PB,並可提供最高1.6 TBps及5000萬IOPS/機架。HPE將ClusterStor定位為執行Cray EX超級電腦的百億億級算力(Frontier、Aurora、El Capitan)、準百億億級算力(LUMI、Perlmutter、Adastra)及國家級AI超級電腦(Isambard-AI、AIps、Shaheen III)配套儲存方案。

Ulrich Plechschmidt

HPE並列HPC與AI儲存產品行銷部門的Ulrich Plechschmidt表示,新的Cray Storage Systems C500將「以遠低於以往入門價格的水平提供E1000領先級儲存技術,同時提高其易用性。」

Plechschmidt解釋稱,C500基於E1000,主要面向希望在較小計算集群上執行建模、仿真及AI工作負載的客戶。這類計算集群通常使用Cray XD系統構建而成。

Cray EX系統是一款液冷、機架規模的高端超級電腦,而配置較低的XD系列則提供風冷與液冷兩種選項,並采用2RU機櫃。EX與XD系列均支持AMD及英特爾x86 CPU外加輝達Hopper GPU。

其中定位中端的XD665支持Slingshot 11、Infiniband NDR及乙太網路網路,並在其調整結構、GPU、NVMe驅動器及CPU之間提供直接可切換連線。據我們掌握的訊息,其並不支持輝達的GPUDirect協定。

Plechschmidt還不忘挖苦輝達,表示C500系統的買家「可以放心使用,因為您寶貴數據存放所在的檔案系統來自一個充滿活力的社群,而非單一企業巨頭。」

C500執行與E1000相同的Lustre軟體,采用相同的2RU x 24驅動器儲存控制器與5RU x 84 HDD機箱,但在具體設計上融合度更高、成本更為低廉。

帶有控制器及儲存機箱的入門級C500

C500配置細節:

  • ProLiant DL325伺服器比E1000的系統管理單元(SMU)儲存控制器更便宜。

  • 組合後設資料單元(MDU)及可延伸儲存單元快閃記憶體(SSU-F)機箱,可容納2RU x24 NVMe SSD。

  • 支持特定配置中的半填充及滿填充儲存機櫃。

  • 配備2RU x24 NVMe驅動器或5U x 84 HDD的C500擴充套件機箱,可將檔案系統的可用容量提升至2.6 PB全快閃記憶體或4 PB混合(SSD/HDD)容量。

  • 入門級C500可透過24個NVMe SSD提供22 TB至513 TB的可用容量,為計算節點提供高達80 GBps的聚合讀取效能與60 GBps的寫入效能。相比之下,IBM支持GPUDirect的ES3500使用Storage Scale並列檔案系統為輝達GPU提供126 GBps讀取頻寬與60 GBps寫入頻寬。而DDN采用Lustre的A1400X2 Turbo則能夠為輝達GPU提供120 GBps讀取頻寬與75 GBps寫入頻寬。

    Plechschmidt指出,HPE即將「釋出重大軟體改進與新功能,使得儲存系統更易於部署和管理。」但奇怪的是,詳細資訊隱藏在HPE QuickSpecs網頁之後,需要授權合作夥伴或HPE員工方可登入。普通使用者根本無從了解。

    HPE QuickSpecs網頁(https://psnow.ext.hpe.com/#/?url=https://psnow.ext.hpe.com/doc/a50007029enw)

    但HPE已經修復了此問題,並表示「QuickSpecs文件上線時發生了內部斷線,目前尚未徹底解決,特此說明。