7月23日訊息,特斯拉、「X」、xAI CEO 埃隆·馬斯克 (Elon Musk)近日在「X」平台上宣布,自己已經啟動了「世界上最強大的 AI 集群」,以在今年12 月之前建立「世界上最強大的AI」——該系統在單個結構上將整合10萬個輝達(Nvidia)p00 GPU。
馬斯克表示,當地時間淩晨4:20左右開始,在xAI團隊、X團隊、Nvidia和支持公司的努力下,其孟菲斯超級計算工廠「Supercluster」開始正常執行——它在一個RDMA結構上有10萬個液冷p00,是世界上最強大的人工智能訓練集群!
今年 5 月,馬斯克曾表示在 2025 年秋季之前開設超級計算工廠,當時,馬斯克匆匆忙忙地開始了Supercluster的工作,需要購買輝達「Hopper」p00 GPU。這似乎表明,當時這位科技大亨沒有耐心等待 p00 芯片推出,更不用說即將推出的基於 Blackwell 的 B100 和 B200 GPU。盡管預計較新的 Nvidia Blackwell 數據中心 GPU 將在 2024 年底之前發貨。
那麽,根據最新的訊息來看,原本計劃在2025年秋季開業的超級計算工廠,現在有望提前近一年的時間實作了。但目前下結論還為時尚早。但今年早些時候,路透社和The Information交談的訊息人士似乎更有可能在專案時間上說錯了時間節點。此外,隨著 xAI Supercluster的啟動和執行,關於為什麽 xAI 沒有等待更強大或下一代 輝達GPU 的問題也得到了解答。
Supermicro 為 xAI 提供了大部份硬件,該公司的行政總裁 Charles Liang 也對馬斯克的貼文發表了評論稱,「與馬斯克的孟菲斯團隊合作真是太棒了!為了實作目標,我們的執行必須盡可能完美、盡可能快、盡可能高效、盡可能環保——大量的艱苦工作。」
在隨後的推文中,馬斯克解釋說,新的Supercluster」將「從各個方面訓練世界上最強大的人工智能」。從之前的意向聲明來看,xAI 的 100,000 個 p00 GPU 安裝功能現在將針對 Grok 3 模型進行訓練。馬斯克表示,改進後的LLM應該在「今年12月之前」完成訓練階段。
從規模上看,新的xAI的Supercluster在GPU算力上將會超越目前最強的超級電腦,比如Frontier(37,888個AMD GPU),Aurora(60,000個Intel GPU)和Microsoft Eagle(14,400個Nvidia p00 GPU)。
編輯:芯智訊-浪客劍