當前位置: 華文世界 > 科技

中美科技巨頭都在布局,國產DPU水平如何?

2024-04-30科技
【文/觀察者網 呂棟 編輯/張廣凱】
4月28日,中國移動在其算力網絡大會上釋出了一款名為「大雲磐石」的DPU(Data Processing Unit)芯片。據稱該芯片實作了關鍵技術自主可控,頻寬達到400Gbps。
相比常見的CPU和GPU,DPU芯片的知名度並不算高,而且營運商也較少高調釋出芯片。那DPU到底有多重要,以至於中國移動公開稱其是「國產芯片領域的重大技術突破」。
中美科技巨頭都在布局
DPU的全稱是Data Processing Unit,直譯就是數據處理單元,專門用於數據處理。
根據輝達官網定義,加速計算主要基於三個基本要素:CPU用於序列處理和執行超執行緒應用程式;GPU擅長並列處理,並針對加速現代工作負載進行了最佳化;DPU非常適合基礎設施計算任務,用於解除安裝、加速和隔離數據中心網絡、儲存、安全和可管理性工作負載。
對普通人來說,這些純技術上的定義有些晦澀難懂,最多能看出不同芯片有不同分工。
如果簡單點表達就是,CPU在計算架構中有多重任務是總負責,當涉及算術運算和邏輯運算等常規計算,也就是所謂序列處理時,通常CPU更快;但當要大量處理類別統一的數據,也就是平行計算時,GPU更有優勢,這也是大模型訓練更青睞GPU的原因。
隨著AI時代來臨,網絡頻寬和數據量急劇增長,同時CPU效能增速放緩,為尋求效率更高的計算芯片,解決大流量網絡封包處理占用CPU的問題,行業提出了DPU概念。
簡單來說就是,CPU做不好、GPU做不了的任務,可以讓DPU來處理,更專業和安全。
圖源:中國移動
早在2020年,輝達CEO黃仁勛就斷言,DPU將成為未來計算的三大支柱之一,未來數據中心標配是CPU+DPU+GPU,CPU用於通用計算、GPU用於加速計算、DPU進行數據處理。
因此,過去幾年無論是科技巨頭還是創業公司,都在湧入DPU賽道。
例如在美國,亞馬遜雲(AWS)2017年就已將其DPU芯片商業化落地;輝達耗資69億美元收購Mellanox,AMD花費19億美元收購Pensando,也都是為了DPU。
在中國,近幾年華為、阿裏、百度、騰訊和中國移動等都在自研與外購DPU,初創企業中科馭數、雲豹智能、星雲智聯、芯啟源等也在加速各自在DPU領域的布局。
說了這麽多,中國移動這次釋出的DPU產品水平到底怎樣?
根據中國移動的說法,大雲磐石DPU芯片是由中國移動聯合生態鏈共同研發設計,擁有400Gbps的數據傳輸能力,將國產DPU芯片最高傳輸速率提升一倍,達到全球頂尖水平。
「該芯片擁有每秒處理百萬個封包的儲存能力,遠端直接存取數據(RDMA)的時延低至5微秒。同時,還具有低功耗、低成本特性,依托該芯片打造的磐石DPU硬件板卡,較上一代硬件板卡功耗下降50%,成本下降50%。」中國移動表示。
從各廠商強調的資訊來看,DPU作為專門處理數據的芯片,傳輸速率應該是關鍵指標。
輝達披露,該公司最新一代、也是第三代DPU產品BlueField-3,可實作400Gbps的乙太網路和InfiniBand連線;AMD代號為「Giglio」新一代DPU,也可提供2x200Gb/s的傳輸速率。
由此可以看出,至少在傳輸速率這一指標上,中國移動的「大雲磐石」已與頭部芯片廠商的產品保持在同一水準。但要指出的是,輝達2021年4月就釋出了BlueField-3。
圖源:輝達官網
DPU創業公司要死掉90%?
盡管DPU的重要性已被輝達這樣的巨頭認可,但市場對DPU創業前景卻存在不同預期。
賽迪顧問數據顯示,2020年中國DPU產業市場規模為3.9億元,隨著數據中心升級和邊緣計算、新能源汽車、IoT、工業物聯網等產業的發展所帶來的需求增長,預計到2025年中國DPU產業市場規模將超過565.9億元,年復合增長率高達170.6%;全球DPU產業市場規模將超過245.3億美元,年復合增長率為51.73%。
另一邊,一些技術專家曾在2022年預言,DPU創業公司至少要死掉90%。他們看衰的理由包括,DPU沒有統一標準,需要與雲端運算基礎設施緊密繫結,產品通用性問題,沒有明確大客戶等。
彼時有雲專家提到,在一些極簡場景中,參數強大的DPU可以發揮作用,但雲端運算是一個復雜的系統,沒有與軟件充分融合,看起來強大的效能很難發揮出來,實際場景中的效能可能會不到宣稱效能的25%,這就很難在擁有獨特軟硬件架構的雲端運算系統中大規模套用。
還有一些芯片專家直言,輝達前兩代DPU幾乎不能用,第三代應該能吸引一些雲廠商。「輝達在叠代DPU的過程中找雲廠商進行了很多深入溝通。但深入溝通也沒辦法完全了解雲端運算廠商的需求,這也導致了輝達DPU在當時還只有少量客戶,沒有標桿性大客戶。」
但同時要指出的是,自研DPU的中國移動,本身也是雲端運算企業,這讓其與大部份DPU創業公司面臨的市場情況不同。有行業專家指出,雲端運算大廠IT成本占比非常高,對數據和基礎設施的把控非常嚴格,再考慮到數據中心架構變革等因素,所以頭部廠家一定會堅定地自研DPU。
近兩年,營運商在中國雲端運算市場增速迅猛。IDC數據顯示,2023下半年中國IaaS市場中,中國電信占據12.9%的份額,僅落後第二名華為0.6個百分點;中國移動以8.6%的份額排在第五;「營運商陣營在IaaS領域的市場份額穩步上升,為整體市場營收持續提供增長源動力」。
財報顯示,2023年中國電信天翼雲收入972億元,同比增長67.9%;移動雲收入833億元,同比增長65.6%,自有能力收入同比增長超100%;聯通雲實作收入510億元,同比增長41.6%。
作為對比,民營雲巨頭的增速要明顯遜於營運商。財報顯示,阿裏雲2023自然年全年營收約為1053億元,同比增長37%;華為雲實作銷售收入553億元人民幣,同比增長21.9%。
IDC報告評價稱,天翼雲2023年全年財報逼近千億大關,協助央國企等使用者快速上雲和用雲;移動雲繼續強化自身基礎設施布局,在智算、AI平台研發上投入明顯;聯通雲不斷拓寬自身資源池底座,在影片雲、醫療雲、連鎖零售、雲安全營運等領域市場獲得快速發展,雲化收入比例持續攀升。
這次推出自研DPU芯片,應該也是中國移動繼續發力雲市場的最新舉措。該公司稱,磐石DPU將廣泛套用於中國流動數據中心建設,支撐通用計算、智能計算等業務場景使用。
在這次算力網絡大會上,中國移動還透露,中國移動智算中心(呼和浩特)已投產使用。該智算中心部署約2萬張AI加速卡,AI芯片國產化率超85%,智能算力規模高達6.7EFLOPS(每秒670億億次浮點運算)。
不出意外,這則訊息也宣告「亞洲最大單體智算中心」的名頭易主。在此之前,百度陽泉智算中心是亞洲最大單體智算中心,建設規模為4 EFLOPS(每秒400億億次浮點運算)。