當前位置: 華文世界 > 科技

AI芯片受限,海光資訊DCU能否扛起國產替代「大旗」?

2024-04-03科技

除了輝達之外,中國是否具備AI芯片自主替代的能力?

眾所周知,隨著非市場因素的不斷變化,中國相關產業和企業在發展AI的過程中,獲得和使用輝達AI芯片的限制越來越多。那麽問題來了,除了輝達之外,中國是否具備自主替代的能力?近日,媒體頻頻報道稱,海光資訊的DCU有望成為輝達芯片最佳替代者。

事實真的如此嗎?如果是,在替代的過程中,海光資訊又面臨怎樣的機遇和挑戰?

海光DCU系列產品以GPGPU架構為基礎,相容通用的「類CUDA」環境以及國際主流商業計算軟件、人工智能軟件,可廣泛套用於大數據處理、人工智能、商業計算等領域。

值得一提的是,與目前全球主流人工智能企業都在使用的輝達A100產品相比,海光資訊DCU的第一代產品海光「深算一號」生產工藝同為7nm制程,記憶體頻率和視訊記憶體位寬與A100基本相當,視訊記憶體容量、視訊記憶體頻寬和視訊記憶體頻率相當於A100的50%左右,差距比較大的是多卡協同的互動速率,只有A100的30%。總體來講,海光「深算一號」的效能應該能達到輝達A100的40%以上水平。

海光資訊於2023年第三季度釋出的「深算二號」效能相對於「深算一號」提升100%以上,據此估計,此款產品效能至少已達到A100的80%,等到正在研發中的「深算三號」上市,其趕上甚至超越A100應該沒有太大問題。

雖然單純從效能來看,最新的「深算三號」可以達到甚至超越A100的水平;但事實上,發展AI芯片不僅關乎硬件,還關乎軟件生態。一類芯片可能無法支持所有現有的深度學習框架和演算法,這將限制芯片的套用範圍。

具體到GPU,由於當前全球主流深度學習框架均使用CUDA平台進行開發,國產GPU可以透過相容CUDA的部份功能,快速開啟市場,降低開發難度和使用者移植成本。然而,CUDA本身涵蓋功能非常廣泛,且許多功能與輝達GPU硬件深度耦合,包含了許多輝達GPU的專有特性,這些特性並不能在國產AI芯片上全部體現。

有觀點認為,海光DCU並不適合做訓練,尤其不適合做大模型的訓練(因為浮點效能低和無法集群組網)。一方面是推理場景性價比低,大約為2022年主流專用推理芯片10%~15%的效能;另一方面由於海光DCU在最初得到Mi100授權時,把與訓練有關的效能和關鍵特性做了裁剪,導致「高不成(訓練)、低不就(推理)」。

而更大的挑戰還在於,由於海光DCU始於相容通用的「類CUDA」,輝達可能禁止使用第三方硬件,也就是非輝達的GPU透過使用模擬層執行CUDA軟件,而之前輝達只是在線上EULA使用者協定中提出警告而已。雖然業內對此持有不同的看法,因為輝達此前僅是警告,始終沒有付諸行動;但在筆者看來,鑒於目前日益嚴峻的非市場環境因素,我們不應再抱有僥幸心理,而應未雨綢繆,即透過提升自身的軟硬件實力,構築屬於自己的軟硬件生態。

可喜的是,有報道稱,百度、阿裏等互聯網企業已認證透過海光的DCU產品並推出聯合方案,打造全國產軟硬件一體全棧AI基礎設施;此外,科大訊飛、商湯和雲從等國內頭部AI企業,已有大量模型移植並執行在海光DCU平台上。

而為了完善通用計算平台的國產生態,海光還發起成立了海光產業生態合作組織,聯合了體制內外的高校、科研院所和產業鏈上下遊企業,開展「產學研」相結合的協同攻關,為突破行業內關鍵共性技術提供助力。

所謂「萬事開頭難」,隨著海光資訊DCU產品的不斷叠代以及其對生態建設的重視和推進,趕上甚至超越,直至替代輝達的AI芯片,也許只是時間早晚的問題。

*本文刊載於【通訊世界】

總第940期 2024年3月25日 第6期

原文標題:【 AI芯片受限 海光資訊DCU能否擔起替代重任?