當前位置: 華文世界 > 科技

找到GPU平替了?RISC-V專用芯片或最適合AI

2024-07-11科技

針對特定AI套用的專用芯片將成主流

作者/ IT時報記者 林斐

編輯/郝俊慧孫妍

國產芯片要如何「另辟蹊徑」?作為一個全新的開源指令集架構,RISC-V被認為是x86、ARM之外的第三條「路徑」,備受全球芯片開發者的青睞。截至去年,全球RISC-V處理器出貨量已超100億顆。

「RISC-V 是最適合AI的架構。」7月6日舉行的世界人工智能大會(WAIC 2024)的RISC-V 和生成式 AI 論壇上,RISC-V 國際基金會理事長戴路表示:「 RISC-V全部開放,沒有任何限制,不會被某家公司、某個國家壟斷。

本次論壇以 「智」 由「芯」生為主題,由上海開放處理器產業創新中心、芯原微電子(上海)股份有限公司主辦,中國 RISC-V 產業聯盟協辦。

始於CPU 適於AIGC

RISC-V系出名門。1971年,RISC架構最由圖靈獎得主、谷歌TPU團隊負責人David Patterson發明,隨後經歷了RISC-I到RISC-IV四代,並沒有受到太多關註。RISC-V起初也不起眼,但隨著近幾年各種技術壁壘越來越高,完全開源的RISC架構成為x86、ARM之外的首選,尤其是在中國芯片開發者中,熱度逐漸漲高。2019年7月,阿裏巴巴旗下半導體公司平頭哥釋出的玄鐵910,便是RISC-V架構。

不過,近兩年,從業者突然發現,雖然RISC-V始於CPU,卻可能無心插柳,更適合AIGC。

GPU 並不一定是 Transformer 的最優算力芯片,有越來越多的專用芯片正在浮出水面,挑戰輝達最先進的產品,顯示出技術生態的多樣化。 」論壇上中國RISC-V產業聯盟理事長、芯原微電子創始人戴偉民認為,未來的AI時代,隨著基礎大模型市場格局逐步清晰,針對具體套用場景的AI微調將更加普遍, 針對特定AI套用的專用芯片將成為主流。

戴偉民認為,生成式AI需要「三張卡」來協同工作:雲端訓練卡(樹幹)、垂域大模型的微調卡(樹枝)和套用推理卡(樹葉),「單有樹幹沒有樹枝是長不出樹葉的。垂直領域的微調卡和推理卡的數量規模,遠多於雲端卡,而這正是RISC-V的用武之地。」

戴偉民的觀點在市場中已得到印證。本次論壇上,多位嘉賓都提到今年6月份美國芯片創業公司Etched推出AI芯片Sohu,它執行大模型的速度比輝達 p00 要快20倍,比今年3月推出的頂配Blackwell芯片B200也要快10倍。

目前多款主流明星AI大模型,如ChatGPT、Claude、Gemini和Sora都基於Transformer架構,而Sohu是專用於Transformer計算的芯片,作為一塊 ASIC(專用集成電路),Sohu 將Transformer 架構最佳化硬化在芯片中,使其無法執行其他的AI大模型。這也是執行速度比輝達GPU快的主要原因。

在論壇上遠端發言的練維漢來自另外一家加拿大AI芯片公司Tenstorrent。Tenstorrent 成立於 2016 年,以 AI 加速器起家,近兩年也瞄準了RISC-V架構的處理器。目前Tenstorrent 共設計出 3 款芯片,其中Jawbridge是一款小型測試芯片,Grayskull和Wormhole 則是對外商用芯片,可覆蓋訓練和推理場景。

據擔任Tenstorrent公司首席 CPU 架構師一職的練維漢介紹,「Tenstorrent擁有為神經網絡推理和訓練量身客製的專有 Tensix 內核,每個 Tensix內核包含5個RISC-V 內核、1個用於張量運算的陣列數學單元、1個用於向量運算的 SIMD 單元、1MB或2MB的SRAM、用於加速網絡封包運算和壓縮/解壓縮的固定功能硬件。」在實際套用中,5個RISC-V內核各司其職,可以推播、執行的數據量都非常大。

靈活性帶來低功耗

除了開源之外,RISC-V的靈活性也是最大優點。

MIPS CTO Durgesh Srivastava指出,生成式AI芯片領域,ASIC和GPU的競爭在於哪種架構更能滿足未來算力,對開發者更友好。

「RISC-V的開放性和靈活性大有可為。」 戴路指出,RISC-V在做芯片的時候可以加客製指令,對以前的軟件有很好的相容性,而且還有新的一些功能支持。

知合計算CEO孟建熠,曾經在阿裏旗下芯片企業平頭哥擔任副總裁,推動了平頭哥的玄鐵RISC-V生態系建設。

在論壇的圓桌對話中,孟建熠提出,目前芯片行業已經進入「XPU」時代,RISC-V作為開源架構,有很好的拓展性,能夠在較低功耗下實作比較好的計算表現,更容易實作開源生態的「聚沙成塔」效應。

知合計算本身專註於RISC-V的高效能計算。他說自己公司的目標是透過RISC-V架構的創新,將高效能、高能效算力、AI算力等普及。

事實上,隨著近年來,輝達在AI芯片領域的一騎絕塵,功耗問題也越來越被產業鏈所關註。

以輝達最新的GB200加速卡為例,采用兩個B200 GPU和一個獨立的Grace CPU。按照輝達官方說法,相比p00,可以將成本和能源消耗降至1/25。訓練一次2萬億參數和8萬億Tokens的GPT-4,使用Pascal大概需要一年;使用Hopper,可能需要三個月;換成Blackwell,10000顆芯片訓練同樣大小的模型,只需要3吉瓦時,耗時10天。

據【紐約客】報道,ChatGPT每日耗電量或超過 50 萬千瓦時,相當於美國家庭平均用電量的 1.7 萬倍,以響應使用者約 2 億個請求。

現在芯片執行的過程中,有時候會出現「等數據來」的情況,很多功耗被白白浪費,所以芯片不能做得太大,也不需要做那麽大。「RISC-V在這方面有優勢,可以用非常有彈性的方法,根據不同的需求來做不同的設計。」 練維漢指出。

全國近五成RISC-V人才出自上海

經過近十年的創新發展,上海已經成為RISC-V企業、產業和人才最集聚的地區,也是國際RISC-V創新發展的前沿陣地。

論壇上,上海市經濟和資訊化委員會副主任湯文侃透露,上海已有超過100家企業推出基於RISC-V指令的芯片產品,一批企業推出RISC-V完整的開發工具,為RISC-V提供了豐富的芯片載體,構建了RISC-V的產業生態,「上海已經形成了RISC-V完整的產業鏈和良好的生態環境」。

在人才培養方面,交大、復旦、上科大、上大等一批上海本地高校均開設了RISC-V相關教學課程, 每年培養和集聚的RISC-V人才占全國比例近50% ,為RISC-V的持續發展提供堅實的人才基礎。

目前,上海將繼續打造全球領先的RISC-V產業高地,並做好三項工作:一是推動成立RISC-V產業創新中心,面向重點的套用領域聯合行業力量,構建統一的硬件開發平台,加快形成RISC-V全棧解決方案;二是做強RISC-V產業聯盟,加快RISC-V專利池的建設,推動產業健康持續發展;三是加強前沿技術的研究和人才培養,積極參與新指令的擴充套件、新技術的探索,並推動將RISC-V相關的教材納入上海集成電路緊缺人才的培訓計劃。

排版/ 季嘉穎

圖片/ WAIC

來源/【IT時報】公眾號vittimes

E N D