當前位置: 華文世界 > 科技

馬斯克展示Cortex AI超級集群:5萬片輝達H100曝光

2024-09-01科技

馬斯克繼續在超算領域發力,本周他在X上分享了一段影片,展示了他重新命名的「Cortex」AI超級集群。這個位於特斯拉「Giga Texas」工廠的最新擴建部份將容納7萬台AI伺服器,並需要130兆瓦(MW)的冷卻和電力供應,到2026年這一數碼將增加至500兆瓦。

Cortex超級集群影片顯示了正在組裝中的大量伺服器機架。從模糊的影片中可以看出,機架似乎是以每排16個電腦架排列的,每排中間間隔有大約4個非GPU機架。每個電腦架包含8台伺服器。從20秒的影片中可以看到大約16到20排的伺服器機架,粗略估計大約能看到2,000台GPU伺服器,這只是預計總規模的不到3%。

Cortex超級集群將是特斯拉迄今為止最大的訓練集群,它將包含50000片Nvidia p00顯卡和20000台自家硬件。Cortex超級集群旨在解決實際世界中的AI問題,,包括訓練特斯拉的全自動駕駛(FSD)系統,該系統將用於消費者版特斯拉汽車和計劃中的「Cybertaxi」產品,以及訓練Optimus機器人的人工智能,這是一種預計將在2025年開始有限生產的自主人形機器人,用於特斯拉的制造流程。

Cortex是馬斯克開發中的超算集群之一,目前,馬斯克的第一個數據中心——Memphis Supercluster已經投入營運,它由xAI擁有,配備了10萬台Nvidia p00顯卡。所有伺服器都透過單個RDMA結構連線,並同樣由Supermicro提供冷卻支持。馬斯克還宣布了在紐約水牛城建設價值5億美元的Dojo超級電腦的計劃,這也是特斯拉的一個專案。

00:20