當前位置: 華文世界 > 科技

IP核出貨量達130億顆 業界期待AI成就RISC-V生態

2024-08-25科技

本報記者 李玉洋 上海報道

近期,兩場RISC-V(開源指令集架構)會議在上海、杭州兩地接連召開,一場是滴水湖中國RISC-V產業論壇(以下簡稱「滴水湖論壇」),另一場是2024 RISC-V中國峰會。

「這兩個會其實有點區別,滴水湖重在產業落地,RISC-V中國峰會則重在產業的未來,但談的都是高效能計算。」電子創新網創始人兼CEO張國斌告訴【中國經營報】記者,AI需要大算力,當然會成為RISC-V現在最重要的發展方向。

其中,中國工程院院士倪光南在「2024 RISC-V中國峰會開幕會」表示:「根據2023年年底的數據,在芯片領域RISC-V IP核出貨量達到130億顆,完成了ARM經過30年才走過的歷程。」該訊息讓業界振奮。隨著RISC-V在物聯網、嵌入式系統等領域批次套用,並在桌面計算、伺服器、人工智能等領域迅速發展,未來RISC-V有望成為繼X86和ARM之後的第三大主流芯片架構。

而RISC-V國際基金會人工智能與機器學習專委會主席、北京大學講席教授謝濤則期待AI能成就RISC-V生態,就「像當年PC成就X86生態,手機成就ARM生態」一樣。

在半導體行業資深產業分析師黃燁鋒看來,在今年滴水湖論壇產品推介中就能看到包含AI SoC、AI CPU在內的RISC-V芯片。「這在任何CPU指令集的發展歷程中都是相當罕見的:短短四屆滴水湖論壇,人們見證了RISC-V的一路狂飆,現在AI又為RISC-V這輛跑車提供了一次‘氮氣加速’(指加速度很快)的機會。」他表示。

RISC-V優勢在開放性、靈活性

「RISC-V是CPU指令集,談AI芯片,CPU指令集和它有什麽關系?」謝濤表示,今年4月11日, RISC-V國際基金會理事會官宣,人工智能/機器學習是2024年RISC-V國際基金會頂級關鍵戰略最優先的戰略。

在今年的世界人工智能大會上,RISC-V國際基金會理事長戴路也表示,RISC-V是最適合AI的指令集架構。此外,加拿大AI芯片獨角獸Tenstorrent首席CPU架構師練維漢指出,RISC-V非常適合做AI計算,比如大語言模型的存取非常破碎、混亂,這是CPU最擅長做的。

不僅如此,嵌入式處理器開發商MIPS CEO Sameer Wasson也在滴水湖論壇上表示,作為技術奇異點的生成式AI,及數據驅動的資本投入,推動著RISC-V時代的到來。

謝濤認為,基於RISC-V構建AI算力的優勢在於其開放性、靈活性,高度可延伸性、功耗和效率優勢,以及生態系和社區的強有力支持。「像當年PC成就X86生態,手機成就ARM生態,我們期待AI成就 RISC-V這樣的生態。」謝濤說。

「目前,RISC-V AI芯片有兩種主要模式:一種是緊耦合模式(integrated),適合低功耗領域(RISC-V+AI),一種是松耦合模式(attached),適合大算力領域(AI+RISC-V)。」謝濤表示,前者以CPU主幹為骨架,整合在CPU內部,共享程式計數器、寄存器等流水線單元,只是在執行單元部份增加矩陣或向量單元;後者則外掛在CPU上,會有獨立的流水線、寄存器堆、緩存等,是協處理器,可以接收來自及一個或多個CPU的指令,異步執行不同CPU送出的任務。

黃燁鋒進一步指出,RISC-V + AI的緊耦合模式就是透過指令集擴充套件實作AI加速,理論上,ARM公司的Neon、Helium(前者是適用於ARM Cortex-A系列處理器的一種128位元SIMD擴充套件結構,後者是ARM Cortex-M系列產品的MVE一種新的向量指令集擴充套件)都屬於此類;AI + RISC-V的松耦合模式則在RISC-V CPU的基礎上,增加協處理器或加速器——ARM家族的代表是Ethos NPU(該系列是ARM推出的AI微加速器)。

以緊耦合模式的RISC-V AI芯片為例,本次滴水湖論壇展示了來自進叠時空(杭州)科技有限公司的SpacemiT Key Stone K1,號稱是「全球首款8核RISC-V AI CPU」,這顆芯片采用了進叠時空自研的RISC-V智算核X60,它擁有8個核心,頻率最高2.0GHz,核心單核算力比ARM Cortex-A55高30%。

不過,謝濤也指出,中國乃至全球RISC-V+AI生態仍存在生態碎片化、資源投入嚴重不足、缺少組織統籌以及產學研協同不夠的挑戰。

如何撼動CUDA

在AI芯片領域,輝達是絕對的市場霸主,其全球市場占有率高達90%。作為最有希望挑戰輝達霸主地位的公司,AMD仍與輝達有一個數量級的差距。

從近期的財務數據來看,數據中心業務是這兩大GPU巨頭增長的主要驅動力,並在2024年保持高速增長。

財報顯示,輝達在2025財年第一財季(自然年2024年2月至4月)創下了260億美元的季度收入紀錄,其中數據中心業務貢獻了226億美元,同比增長427%。作為對比,AMD在2024年第一季度和第二季度的收入分別為55億美元和58億美元,數據中心銷售額分別達到23億美元和28億美元,分別同比增長80%和115%。

一個越來越為人熟知的事實是,之所以輝達能成為AI芯片市場霸主,除其硬件產品效能優秀外,更在於它構建起了以CUDA(輝達推出的運算平台)為基礎的軟件棧。

「相比於輝達,國產Al芯片除效能差距外,軟件生態差距更大。輝達的成功不僅僅在於其芯片,更在於其軟件棧CUDA的成功。」謝濤表示,CUDA是2006年輝達推向市場的,經過這麽多年的發展,輝達為CUDA生態投入120億美元,目前CUDA開發者已有450萬。

謝濤指出,如今國內高端AI芯片企業達40多家,但軟件棧層面各自為戰,整體市場份額不足10%。

「一些國產和國際AI芯片公司也會采用所謂的‘打不過就加入’的思路,相容CUDA軟件生態,特別是走GPGPU(通用圖形處理器)的路線。這樣的道路能解燃眉之急,但長遠來看還是受制於人。」謝濤表示,當然還有一些AI芯片公司走的是非CUDA路線,但整體上來說AI算力軟件生態呈現小、散、弱的局面。

他還指出,指令集不統一,硬件架構分散;軟件棧不統一,使用者學習成本高;算子覆蓋度低,使用者遷移成本高,以及企業各自為戰,沒有足夠的生態競爭力,這些都導致國產AI芯片競爭力的缺乏。

但輝達的CUDA生態是相對封閉的。對此,謝濤指出歷史上能夠擊敗閉源霸主生態的往往是一個開源的生態。

「在IT歷史上,當一個閉源生態占據主導地位的時候,基本上沒有看到一個成功的例子是說第二個後來居上的閉源生態撼動(原先)霸主生態。但有兩大案例,是開源的生態去震撼閉源霸主的生態,一個Linus VS Windows,一個是Android VS iOS。」謝濤說,RISC-V指令集本身是開源的,且已有了相當的芯片出貨量及開發生態基礎。

言下之意,選擇RISC-V做AI芯片的理由又多了一個,即用開源的RISC-V生態來撼動輝達的CUDA生態。

針對以上當前構建中國RISC-V+AI生態存在的挑戰,謝濤認為,可以采用自下而上的思路,以RISC-V指令集擴充套件+開源系統軟件棧(並推成標準)為「公共開源根」,利用國際開放/開源社區「長葉」(基於開源根的商業軟件/芯片),形成「根技術開源」與「葉技術競爭」的技術生態優勢。

謝濤提出,應聚焦邊緣計算和智能終端等多樣化套用場景,推動軟件生態的發展,進而帶動雲上軟件生態,這種「農村包圍城市」的策略來與現有巨擘抗衡,逐步建立RISC-V在AI領域的市場地位。再依托日益強大的RISC-V軟硬件生態,聚焦全球開源工具創新,最終達成類似Android VS iOS或Linux VS Windows的競爭格局。

關於具體破局思路,謝濤提出了國際標準+開源社區兩抓手。「一是以推動RISC-V國際標準為抓手到國際借力,把握‘根技術’,快速布局新市場(如智能終端、AI PC等),以推動國際基金會標準來依托上遊國際開源社區貢獻系統軟件棧。二是以共建國際開源軟件生態為抓手到國際借力,到國際開源軟件生態(如Triton、SYCL)中發出中國強聲音。」謝濤說。

在謝濤看來,Triton(開源的GPU程式語言)與SYCL(由英特爾主推,和CUDA同層級的跨平台抽象層)是RISC-V AI生態發展的關鍵,SYCL被他類比為「編程模型中的RISC-V」,相對的CUDA是編程模型中的X86。

黃燁鋒指出,Triton實作了硬件無關的中間層表示,生態相容負擔小,編程難度相較CUDA更低,但仍能實作接近於CUDA極限生態的效能。