AI芯片受限，海光資訊DCU能否扛起國產替代「大旗」？

2024-04-03科技

除了輝達之外，中國是否具備AI芯片自主替代的能力？

眾所周知，隨著非市場因素的不斷變化，中國相關產業和企業在發展AI的過程中，獲得和使用輝達AI芯片的限制越來越多。那麽問題來了，除了輝達之外，中國是否具備自主替代的能力？近日，媒體頻頻報道稱，海光資訊的DCU有望成為輝達芯片最佳替代者。

事實真的如此嗎？如果是，在替代的過程中，海光資訊又面臨怎樣的機遇和挑戰？

海光DCU系列產品以GPGPU架構為基礎，相容通用的「類CUDA」環境以及國際主流商業計算軟件、人工智能軟件，可廣泛套用於大數據處理、人工智能、商業計算等領域。

值得一提的是，與目前全球主流人工智能企業都在使用的輝達A100產品相比，海光資訊DCU的第一代產品海光「深算一號」生產工藝同為7nm制程，記憶體頻率和視訊記憶體位寬與A100基本相當，視訊記憶體容量、視訊記憶體頻寬和視訊記憶體頻率相當於A100的50%左右，差距比較大的是多卡協同的互動速率，只有A100的30%。總體來講，海光「深算一號」的效能應該能達到輝達A100的40%以上水平。

海光資訊於2023年第三季度釋出的「深算二號」效能相對於「深算一號」提升100%以上，據此估計，此款產品效能至少已達到A100的80%，等到正在研發中的「深算三號」上市，其趕上甚至超越A100應該沒有太大問題。

雖然單純從效能來看，最新的「深算三號」可以達到甚至超越A100的水平；但事實上，發展AI芯片不僅關乎硬件，還關乎軟件生態。一類芯片可能無法支持所有現有的深度學習框架和演算法，這將限制芯片的套用範圍。

具體到GPU，由於當前全球主流深度學習框架均使用CUDA平台進行開發，國產GPU可以透過相容CUDA的部份功能，快速開啟市場，降低開發難度和使用者移植成本。然而，CUDA本身涵蓋功能非常廣泛，且許多功能與輝達GPU硬件深度耦合，包含了許多輝達GPU的專有特性，這些特性並不能在國產AI芯片上全部體現。

有觀點認為，海光DCU並不適合做訓練，尤其不適合做大模型的訓練（因為浮點效能低和無法集群組網）。一方面是推理場景性價比低，大約為2022年主流專用推理芯片10%~15%的效能；另一方面由於海光DCU在最初得到Mi100授權時，把與訓練有關的效能和關鍵特性做了裁剪，導致「高不成（訓練）、低不就（推理）」。

而更大的挑戰還在於，由於海光DCU始於相容通用的「類CUDA」，輝達可能禁止使用第三方硬件，也就是非輝達的GPU透過使用模擬層執行CUDA軟件，而之前輝達只是在線上EULA使用者協定中提出警告而已。雖然業內對此持有不同的看法，因為輝達此前僅是警告，始終沒有付諸行動；但在筆者看來，鑒於目前日益嚴峻的非市場環境因素，我們不應再抱有僥幸心理，而應未雨綢繆，即透過提升自身的軟硬件實力，構築屬於自己的軟硬件生態。

可喜的是，有報道稱，百度、阿裏等互聯網企業已認證透過海光的DCU產品並推出聯合方案，打造全國產軟硬件一體全棧AI基礎設施；此外，科大訊飛、商湯和雲從等國內頭部AI企業，已有大量模型移植並執行在海光DCU平台上。

而為了完善通用計算平台的國產生態，海光還發起成立了海光產業生態合作組織，聯合了體制內外的高校、科研院所和產業鏈上下遊企業，開展「產學研」相結合的協同攻關，為突破行業內關鍵共性技術提供助力。

所謂「萬事開頭難」，隨著海光資訊DCU產品的不斷叠代以及其對生態建設的重視和推進，趕上甚至超越，直至替代輝達的AI芯片，也許只是時間早晚的問題。

*本文刊載於【通訊世界】

總第940期 2024年3月25日第6期

原文標題：【 AI芯片受限海光資訊DCU能否擔起替代重任？ 】