當前位置: 華文世界 > 科技

AI巨頭籌劃價值1100多億美元的超級電腦計畫

2024-03-30科技

本文由半導體產業縱橫(ID:ICVIEWS)綜合

美國的超級電腦又有新看點了。

據報道,Microsoft 和 OpenAI 正在開發一個大型數據中心,以容納一台擁有數百萬個GPU 的專註於AI的超級電腦。The Information報道稱,該計畫的成本可能「超過1150億美元」,而目前在OpenAI內部被稱為「星際之門」(Stargate)的超級電腦將位於美國。

該報告稱,Microsoft將為數據中心買單,該數據中心可能比當今一些最大的營運中心「成本高出100倍」。Stargate將是兩家公司希望在未來6年內建立的一系列數據中心計畫中最大的一個,高管們希望在2028年之前執行它。

報告稱,OpenAI和Microsoft正在分階段構建這些超級電腦,Stargate將是第5階段的系統。The Information的訊息人士稱,第4階段的系統成本更低,最早可能在2026年啟動,並且可能希望在威斯康辛州的Mt. Pleasant開始。該系統可能需要幾個Stargate,還需要足夠的電力供應(至少幾千百萬瓦),以至於Microsoft和OpenAI正在考慮替代能源,例如核能。

訊息人士表示,這種規模的數據中心將具有挑戰性,部份原因是現有設計需要「將比過去更多的GPU放入單個機架中,以提高芯片的效率和效能,這意味著還要設計新穎的方法來保持良好的散熱效能。

聽起來這些公司也有可能利用這個設計來擺脫對輝達的依賴。該報告稱,OpenAI希望避免在Stargate中使用輝達的InfiniBand電纜,盡管Microsoft在當前的計畫中使用它們。OpenAI聲稱它寧願使用乙太網路電纜。

很多事情仍有待確定,因此價格和計劃似乎都可能發生變化,目前尚不清楚何時會最終確定細節。該資訊還指出,尚未確定這台電腦將位於何處,以及它是將構建在單個數據中心還是「鄰近的多個數據中心」中。

今年早些時候,有報道稱,OpenAI執行長山姆·艾爾特曼(Sam Altman)雄心勃勃地制造人工智慧芯片,並希望籌集多達7萬億美元來建設晶圓廠來生產它們。去年,Microsoft 釋出了專門用於 AI 計畫的 128 核 Arm 數據中心 CPU 和 Maia 100 GPU。也有報道稱,Microsoft為人工智慧數據中心開發自己的網路裝置。隨著人工智慧的興起,輝達的GPU需求量很大,因此,像Microsoft和OpenAI這樣的公司可能希望有一些其它選擇是有道理的。

「我們一直在規劃下一代基礎設施創新,以繼續推動人工智慧的發展,」Microsoft首席通訊官法蘭克·肖(Frank Shaw)告訴The Information,但他沒有直接評論該超級電腦計劃。

Microsoft在與OpenAI的合作中投入了數十億美元,主要是以計算能力的形式執行其模型。如果Stargate或類似的東西成為現實,隨著投資的規模越來越大,而且越來越復雜,這種夥伴關系只會越來越深。

美國超算有哪些?

2023年11月,全球超級計算大會正式公布了第62期全球超級電腦TOP500排行榜,美國橡樹嶺國家實驗室的Frontier仍保持著第一名位置,中國的神威·太湖之光和天河二號A也進入了前十五,分別排名第11和第14。

排名第一的Frontier以1.194 EFlop/s的HPL效能繼續保持領先地位。其搭載了基於最新的HPE Cray EX235a架構的2GHz AMD EPYC 64C 處理器,共有8699904個CPU和GPU核心。此外,Frontier還具有高達52.59 GFlops/W的額定能效,並可借助於HPE的Slingshot 11網路進行數據傳輸。

排名第二是美國阿貢國家實驗室的Aurora超級電腦,其以585.34 PFlop/s的HPL效能殺入榜單。需要指出的是,此次 Aurora 的數值是在當前未完全建成狀態下送出的,目前僅有計劃中最終規模的一半。根據規劃,Aurora 在建設完成後將配備21248個Intel Xeon Max系列CPU、63744個Intel Max系列GPU、20.42PB記憶體,峰值效能可達 2 EFlop / s,遠超 Frontier。

排名第三的是安裝於微軟美國Azure雲中的Eagle,HPL效能為561.2 PFlop/s,這也是雲服務廠商取得的最高排名。其基於英特爾至強鉑金8480C處理器和輝達p00打造。

排名第四的是日本的富嶽超級電腦,HPL分數為442.01 PFlop/s,基於富士通自研的基於Arm架構的 48 核處理器A64FX,總共裝有大約16萬個CPU芯片。

排名第五的是來自芬蘭卡亞尼歐洲高效能計算中心的超級電腦LUMI,HPL效能達379.07 PFlop/s,基於HPE Cray EX235a 架構,配備了2GHz AMD EPYC 64C 處理器和AMD Instinct MI250X GPU。

排名第六的是義大利 CINECA 的一個 EuroHPC 站點上的 Leonardo 系統,HPL效能達 238.7 Pflop/s。它是一個 Atos BullSequana Xp000 系統,處理器為Intel Xeon Platinum 8358 32C 2.6GHz,加速器為 NVIDIA A100 SXM4 40 GB,采用四軌 NVIDIA HDR100 Infiniband 作為互連。

排名全球第七是美國田納西州橡樹嶺國家實驗室(ORNL)的Summit超級電腦,由 IBM 打造,目前在 HPL 效能為 148.8 Pflop/s,擁有 4,356 個節點,每個節點配備兩個 POWER9 CPU(每個具有 22 個核心)和6個 NVIDIA Tesla V100 GPU(每個含有 80 個 SM),透過 Mellanox 雙軌 EDR InfiniBand 網路保持連線。

第八名是西班牙 EuroHPC / 巴塞隆納超級計算中心最新安裝的 MareNostrum 5 ACC 超算系統,這個 使用 Xeon Platinum 8460Y 處理器以及 NVIDIA p00 和 Infiniband NDR200,實作了 183.2 Pflop/s 的 HPL 效能。

排名第九的新 Eos 系統是輝達打造的基於DGX SuperPOD 的系統,配備Intel Xeon Platinum 8480C 處理器、NVIDIA p00 加速器和 Infiniband NDR400 的 NVIDIA DGX p00,實作了 121.4 Pflop/s 的效能。

排名第十的是美國加利福尼亞州勞倫斯利佛摩國家實驗室的 Sierra 系統。它的架構與排名第七的系統 Summit 非常相似,由 4,320 個節點組成,每個節點配備兩個 POWER9 CPU 和四個 NVIDIA Tesla V100 GPU,可實作 94.6 Pflop/s 的效能。

此外,GREEN500 排名第一的位置仍然是美國紐約熨鬥研究所的 Henri。該系統的能效等級為 65.40 GFlops / Watt,同時 HPL 得分為 2.88 PFlops / s。Henri 是一台聯想 ThinkSystem SR670,配備 Intel Xeon Platinum 和 NVIDIA p00,共有 8,288 個核心,在 TOP500 排行榜上排名第 293 位。

*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯系後台。