當前位置: 華文世界 > 科技

三大營運商爭相布局,全球掀起AI算力中心「軍備競賽」

2024-05-05科技

人工智慧領域近年來正在迎來一場由生成式人工智慧大模型引領的爆發式發展。2022年11月30日,OpenAI公司推出一款人工智慧對話聊天機器人ChatGPT,其出色的自然語言生成能力引起了全世界範圍的廣泛關註,2個月突破1億使用者,國內外隨即掀起了一場大模型浪潮,Gemini、文心一言、Copilot、LLaMA、SAM、SORA等各種大模型如雨後春筍般湧現,2022年也被譽為大模型元年。

人工智慧也因此被視為革命性的技術,對世界各國政府具有重要的戰略意義。數據顯示,今年,中國生成式人工智慧的企業采用率已達15%,市場規模約為14.4萬億元。在制造業、零售業、電信行業和醫療健康等四大行業的生成式人工智慧技術的采用率均取得較快增長。

作為推動人工智慧發展的三大要素之一,算力被稱為人工智慧的「發動機」和核心驅動力。算力是指裝置透過處理數據,實作特定結果輸出的計算能力。中國電信研究院戰略發展研究所高級分析師陳元謀表示,算力指數每提升一個點,對數位經濟的拉動大概是在0.36個百分點,對GDP的拉動大概是0.17個百分點

算力的緊缺甚至已成為制約人工智慧研究和套用的關鍵因素。對此,美國對華高端算力產品采取了禁售措施,華為、龍芯、寒武紀、曙光、海光等企業都進入實體清單,它們芯片制造的先進工藝受限,國內可滿足規模量產的工藝節點落後國際先進水平2-3代,核心算力芯片的效能落後國際先進水平2-3代。

01

算力短缺催生算力中心巨大市場

21世紀,移動計算和雲端運算蓬勃發展。雲端運算的出現,使得算力可以像水和電一樣,透過網路「流動」到需要它的每一個角落。

人工智慧的崛起對算力提出了更高的要求,GPU(Graphics Processing Unit,圖形處理單元)和TPU(Tensor Processing Unit,張量處理單元)等專用硬體的出現,極大地提高了處理效率,為機器學習模型的訓練和推理提供了強大的支持。

疊加算力緊缺的因素,進一步促成和孕育了算力中心這樣一個巨大市場。算力中心是指具備高效能計算、大規模儲存、高速網路等基礎設施的計算中心,旨在提供大規模、高效率、低成本的算力服務。

以國內為例,全國多地都在加速布局公共算力基礎設施。在上海,建設了全國第一個算力交易平台和人工智慧公共算力服務平台。在廣州,建設了國內第一個算力資源釋出共享平台。可以說,這些公共平台給供需雙方牽了線搭了橋。

目前,國內在8個地區建設國家算力樞紐節點,並規劃了10個國家數據中心集群,以構建國家算力網路體系。截至2023年底,國內智算中心計畫為128個,其中83個計畫披露規模,規模總和超過7.7萬P。另外,2024年共有39個智算中心計畫已投產。

02

智算缺口猶存,三大營運商布局智算中心

近兩年來,AI大模型層出不窮,對智算的需求也在飛速增長。市場咨詢機構IDC預計,2026年,中國智慧算力規模將進入每秒十萬億億次浮點(ZFLOPS)級別,達到1271.4EFLOPS。此前六部門釋出的【算力基礎設施高品質發展行動計劃】明確了頂層算力在未來三年的建設節奏。其中提及,2023年至2024年智算建設缺口為23EFlops。2025年全國算力目標超過300EFlops,智算比例達到35%,智算算力目標為105EFlops。

針對於此,近年來三大營運商也在積極布局智算中心,並提出相關戰略部署。

中國聯通在提供專業化智算基礎設施服務方面,布局了「1+N+X」智算能力體系,包括了1個超大規模的單體智算中心、N個智算訓推一體樞紐和屬地化的X個智算推理節點。

中國移動強化「4+N+31+X」數據中心布局,圍繞熱點、中心、邊緣實作算力資源覆蓋,建設邊緣節點超1000個。「4+N+31+X」數據中心體系,其中「4」指京津冀、長三角、粵港澳大灣區、成渝等4個熱點業務區域,「N」指國家樞紐節點10 個數據中心集群內規劃的超大型數據中心;「31」指各省規劃超大型數據中心;「X」指各地市級數據中心及匯聚機房。

中國電信則提出了「雲網融合」的理念,形成了「2+4+31+X+O」的算力布局。其具體特指在內蒙古和貴州兩個全國性雲基地打造融合資源池,在京津冀等4個大區建成大規模公有雲;在31個省省會級和重點城市建設屬地化專屬雲;在X節點打造差異化邊緣雲;布局「一帶一路」沿線國家,將算力體系延展至海外。

03

美歐日大舉投資,全球掀起AI算力 「軍備競賽」

當前,全球範圍內的各國都在制定各自的人工智慧戰略和政策,以推動 AI 產業發展。

美國在 2016 年釋出的【美國人工智慧研究和發展戰略計劃】中就明確提出了加強 AI 基礎設施的建設。同時,歐洲聯盟也在 2018 年釋出的 AI 戰略中明確提出了加強基礎設施建設的目標。這些基礎設施主要包括計算資源、數據資源、人才資源等。日本緊跟美國步伐,相繼於2019年、2021年、2022年出台3版【人工智慧戰略】。去年四月,日本政府成立人工智慧戰略小組,由首相輔佐官村井英樹擔任組長,組員包括內閣官房、外務省、數位廳等部門人工智慧政策主管官員。

在一系列戰略部署下,美日歐等國家和地區也在爭相建設算力中心,全球掀起AI算力「軍備競賽」。

去年11月,美國國家超級計算中心和諸多AI領域龍頭公司聯合組建了萬億參數聯盟(TPC)。該聯盟由來自全球的科學家組成,目標是共同推進用於科學發現的AI模型,特別關註一萬億或更多參數的巨型模型。目前,TPC正在開發可延伸模型架構和訓練策略,並組織整理用於模型訓練的科學數據,以最佳化當前和未來的百萬兆次級計算平台的AI庫。

此外,美國能源部下屬的橡樹嶺國家實驗室、勞倫斯·利佛摩國家實驗室以及 IBM、NVIDIA公司成立超級電腦卓越實驗中心,聯合開發新一代 HPC 電腦,使用 IBM 的Power 處理器及 NVIDIA 的 Teslak 加速卡,浮點效能至少 10 億億次,最高的可達 30 億億次。

2020年12月,歐盟擬為「數位歐洲」計劃撥付75億歐元,其中22億歐元用於超級計算,21億歐元用於人工智慧。該計劃具體包括:在2021年底前至少收購1台百萬兆級超級電腦;在健康、制造和能源等領域建立可用於人工智慧的全歐數據空間及測試設施;部署泛歐量子通訊基礎架構並支持建立網路安全產品認證計劃;專設人工智慧、高級計算和網路安全碩士計劃等。

去年3月,英國政府承諾向超級計算和人工智慧研究投入10億英鎊(13億美元),希望成為「科技超級大國」。作為該戰略的一部份,政府表示,希望花費約9億英鎊建造一台「超大規模」 電腦,它能夠構建自己的「BritGPT」,與OpenAI的生成式AI聊天機器人相媲美。

今年四月,日本經濟產業省將向5家日本企業提供總額725億日元的補貼,用於打造人工智慧超級電腦,旨在減少對美國的技術依賴。日本政府為Sakura Internet、日本電信巨頭 KDDI、GMO 互聯網、Rutilea 和 Highreso 分別提供 501 億、102 億、19 億、25 億和 77 億日元的政府補貼。訊息顯示,日本「產業技術綜合研究所」將最早於今年開發出一台超級電腦,其計算能力大約是現有機器的 2.5 倍。在日本經產省的監督下,該機構將透過雲服務將這台超算提供給開發生成式 AI 的日本國內企業。

除了政府支持的計畫外,全球科技企業也在砸錢建算力。亞馬遜計劃未來15年投資 1480 億美元在全球各地建設數據中心,滿足人工智慧等需求。谷歌公司宣布投資 30 億美元用於建設或擴建位於維吉尼亞州和印地安納州的數據中心園區。微軟、OpenAI也正在進行一項分為五個階段的超級電腦建設計畫,擬動用的投資將超過1150億美元,其中大部份的成本將用在采購驅動AI所需的算力設施。

04

營運商啟動大規模采購,AI芯片市場爆發

大規模的布局算力中心也帶來了對AI芯片的大規模采購。

近日,中國移動啟動大規模AI芯片集采引發業界廣泛關註。中國移動啟動2024年至2025年新型智算中心采購。招標公告顯示,本次計畫采購總規模達到8054台。有機構測算,按照此前中標報價,此次采購規模或超過150億元。

一個月前,中國聯通也啟動了超過2500台AI伺服器采購,而中國電信此前也早已行動。隨著三大營運商啟動大規模招標,在業內看來,國內算力部署已經駛上「快車道」。

就在2個月前,中國移動還釋出了2023年至2024年新型智算中心(試驗網)集采計畫,12個標包對應AI訓練伺服器采購量總計達到2454台(1-11標包集采1204台,12標包集采1250台)。

在3月底,中國聯通釋出2024年中國聯通人工智慧伺服器集中采購計畫資格預審公告,公告顯示,2024年中國聯通人工智慧伺服器集中采購計畫已批準,招標人為中國聯合網路通訊有限公司及省分公司、聯通數位科技有限公司等。此次中國聯通將采購人工智慧伺服器合計2503台,關鍵組網裝置RoCE交換機合計688台,本次采購不劃分標包。

去年10月,中國電信也公布了AI算力伺服器(2023-2024年)集中采購計畫評審結果,超融合、浪潮、新華三等廠商入圍,合計采購4175台AI伺服器和1182台交換機。

05

算力中心建設帶動AI芯片廠商受益

目前來看,主要有建設算力中心的企業包括營運商、大型雲服務企業和大型互聯網企業。這些企業資金充沛,體量大,能承擔建設算力中心的巨額費用。同時,其對算力需求巨大,也有豐富的下遊客戶可以出售算力。

2023 年 10 月 17 日,美國商務部出台了出口管制清單的 ECNN 3A090 和 4A090 要求,以進一步限制高效能 AI 芯片的出口,同時將 13家中國公司列入實體清單。修改後的出國管制設計 產品包括但不限於:輝達 A100、A800、p00、H800、L40、L40S 以及 RTX 4090 產品。由於美國對國內算力AI芯片的采購限制。目前算力中心和相關AI芯片已形成國內外兩個市場。

國內巨大的算力市場帶動了國產芯片廠商受益。近日,中國移動正式宣布建成全球營運商最大單體智算中心——中國移動智算中心(呼和浩特),目前已投產使用。該智算中心計畫部署約2萬張AI加速卡,AI芯片 國產化率 超85%。

中國聯通近日也在北京建成了全國第一個「政府+營運商」智算中心,算力中心繼續沿用 全國產化的昇騰AI 基礎軟硬體。

此前,中國電信上海公司在上海點亮的「大規模算力集群暨人工智慧公共算力服務平台」,是全國規模最大的營運商級智算中心,算力集群規模達15000卡,采用 自主創新AI芯片 。年初投入營運的中國電信中部智算中心也采用了基於 國產AI基礎軟硬體 平台的方案架構。

不難發現,國內算力中心多采用國產AI軟硬體。目前GPU在AI芯片市場用量最大,目前國產AI芯片采購主要受益中國代表企業包括華為、海光資訊、景嘉微、燧原科技等。去年百度為200台伺服器便訂購了1600片昇騰910B AI芯片。

據機構測算,受輝達限令升級影響,2024年AI國產芯片新增市場空間將達到700億以上。

國外其他主要市場在芯片采購方面收到的限制較小。全球AI芯片市場當前基本被以輝達為代表的歐美大廠主導,業界數據顯示,輝達以80%的市占率幾乎「壟斷」AI芯片市場。此前輝達的CEO黃仁勛還宣布,他們將在日本建立AI工廠,並且該工廠優先供應日本本土的GPU需求。

06

競爭加劇,大廠開始自研AI伺服器芯片

目前普遍認為,人工智慧熱潮下,受益最多的是「賣鏟子」的AI芯片廠商。數據顯示,芯片成本在基礎型伺服器中約占總成本的32%,而在高效能或更強效能的伺服器中,芯片成本占比高達 50%~83%。

過高的成本也導致有越來越多的互聯網和IT裝置大廠開始自研AI伺服器芯片。

2016年,谷歌推出了自研的AI張量處理單元(TPU),2022年前後,谷歌開始研發基於Arm架構的伺服器CPU,2024年4月,谷歌釋出了自研Arm構架CPU——Axion,並宣布該芯片已經在內部使用。

2020年,微軟開始為其Azure雲服務客製芯片,2023年11月,微軟推出了兩款自研芯片——Maia100和Cobalt100。Maia100是一款專為大語言模型訓練和推理而設計的芯片,采用台積電5nm制程,Cobalt100是一款基於Arm架構的128核伺服器CPU。

今年4月初,Meta釋出了新一代AI訓練和推理加速器MTIA,其計算和記憶體頻寬是上一代產品的兩倍多,最新版本芯片有助於驅動Facebook和Instagram上的排名和推薦廣告模型。

此前,有報道稱,美國AI研究公司OpenAI正在與包括阿聯政府在內的潛在投資者進行談判,試圖推動一個旨在提高全球芯片制造能力的計畫,重塑全球半導體行業。其中一名知情人士透露,該計劃準備籌集高達5萬億至7萬億美元。

此外國內大廠也不逞多讓,開始研發AI芯片。近日,中國移動在其2024算力網路大會上正式釋出大雲磐石DPU,該芯片頻寬達到400Gbps,為國內領先水平。