AI芯片公司圍攻GPU王者輝達

2024-08-31科技

全球初創企業正試圖證明它們可以在某些套用領域提供比行業巨頭輝達更好的芯片解決方案。雖然輝達的GPU繼續主導人工智慧（AI）領域，但AI初創企業認為，GPU的高能耗和龐大的設計留下了市場空隙，供新興企業填補，希望分享AI技術繁榮帶來的利益。

AI芯片主要有兩種基本型別：一種是「推理」芯片，用於執行現有的AI模型；另一種是「訓練」芯片，用於開發新的AI模型的高效能數據處理元件。例如，OpenAI需要成千上萬的訓練芯片來開發新的ChatGPT模型，而ChatGPT回答問題時會使用推理芯片。

隨著聊天機器人和其他生成式AI應用程式變得越來越流行，人們對AI推理的需求將呈指數級增長，該市場規模最終將達到數百億美元。

輝達的成功主要受益於訓練芯片市場的繁榮，因為其GPU能夠處理開發AI模型所需的大量平行計算。但GPU價格昂貴且體積龐大，無法成為輕薄膝上型電腦和可穿戴裝置的可行選擇。輝達用於數據中心的AI芯片每片售價為2.5萬~4萬美元，是傳統產品的7~8倍。

即使是輝達的供應商也提到了價格問題 。南韓SK集團董事長崔泰源（Chey Tae-won）在7月份表示，「很多公司希望使用他們自己的芯片，而不是更昂貴的輝達芯片。」崔泰源表示，如果像微軟和谷歌這樣的新興企業能夠制造更便宜的AI芯片，「我認為輝達主導的商業模式可能會被打破。」

價格並不是唯一的問題。據報道， 輝達的下一代Blackwell芯片消耗高達1200 W 的電力 。美國芯片初創公司Esperanto最近表示，「幾年前，消耗超過100W的芯片被認為是相當極端的。」有專家估計，訓練一個像ChatGPT-3這樣的模型所消耗的電力比1000個家庭一年的用電量還多。

研究公司Omdia咨詢總監Kazuhiro Sugiyama表示，「輝達的GPU主要適用於訓練，但我們看到越來越多的新興企業開發既可用於訓練又可用於推理的芯片。 2025年至2026年期間，我們將看到更多企業進入由輝達主導的市場，因為大型科技公司開始供套用於自身服務的專用AI芯片。 」他補充道，輝達產品價格高昂，「這對想投資AI的公司來說是一個負擔。」

這些新興企業包括由軟銀願景基金支持的美國公司SambaNova Systems，由前英特爾工程師創立的Tenstorrent，以及最近被軟銀收購的英國公司Graphcore。大科技公司如谷歌、Meta和亞馬遜AWS也紛紛加入競爭，更不用說輝達的競爭對手AMD了。全球各地的AI創企和科技巨頭們都在試圖證明自己在圖形芯片領域的價值。

Preferred Networks

Preferred Networks成立於2014年，目前已成為估值約3470億日元（21億美元）的日本最大AI獨角獸，將首次尋求海外投資者，以加速芯片開發。該公司主要透過與客戶公司共同開發AI服務來獲得收入。

與許多專註於AI軟體的日本初創公司不同，Preferred Networks采用的是垂直整合業務模式，為其AI服務開發自己的超級電腦和芯片，但采用「無晶圓廠」模式，即依賴於台積電等代工廠來制造芯片。這種做法的一個原因是能夠為欠已開發國家/地區提供負擔得起的AI服務。這意味著未來AI服務的成本很大程度上可能由執行這些服務所需芯片的成本決定。

Preferred Networks及其合作夥伴，包括一家國家研究機構，計劃在2027年3月前開發下一代AI加速器芯片。

Preferred Networks芯片設計負責人、神戶大學教授Junichiro Makino表示，公司 旨在使新芯片「比輝達的B200芯片更強大且能耗更低」 ，後者采用了Blackwell芯片。

簡而言之，Preferred Networks希望透過軟體使AI芯片更高效。軟體將決定如何有效地處理特定任務，並將數據和計算分配給芯片內部的各個核心——即芯片內的小型「處理器」。這使得每個核心能夠專註於與其任務相關的數據，而不像傳統GPU那樣，核心之間更為交織。反過來，這意味著需要的核心數量更少，從而在保持相同計算能力的情況下降低能耗。

雖然這是一個訓練芯片，但Preferred Networks相信這項技術最終可以被改進用於更具成本效益的推理解決方案。

Preferred Networks還在開發一種新的大型語言模型Plamo，專為數據量較少的語言（如日語或其他亞洲語言）客製。Toru Nishikawa表示，開發準確的AI模型需要大量數據，因此開發基於「次要」語言的大語言模型比開發英語、日語等模型更具挑戰性。

Edgecortix

GPU從未被設計成為針對AI的最高效解決方案。它們的最初目的是確定遊戲中數百萬個像素的顏色。每次計算都相對簡單，但要處理快速移動的高分辨率影像，需要成千上萬個核心同時執行。研究人員在21世紀初註意到它們的潛力，並開始修改輝達的GPU以執行復雜的計算。從2000年代末期開始，輝達逐漸適應了這種新興需求。

不過，對於那些追求更優雅的AI芯片設計的初創企業來說，輝達透過增加更多核心和記憶體來提高AI芯片效能的方式就像是「用蠻力解決問題，制造更大更貴的芯片」，但效率太低。

輝達也在制造專用的AI芯片，甚至包括一些推理芯片，但據Omdia咨詢總監Kazuhiro Sugiyama說，其架構策略並未發生太大變化，仍然是調整其軟體平台以適應特定套用，例如AI或自動駕駛汽車。輝達還采用了一種更為多用途的設計方法，優先考慮能夠執行多種前沿AI的芯片。

據一位行業人士透露，初創企業可以透過專註於特定套用來競爭。這是日本AI芯片初創企業Edgecortix采取的部份戰略，該公司成立於2019年，由前微軟和美國IBM公司工程師Sakyasingha Dasgupta所領導，正試圖解決「記憶體墻」問題。

GPU擅長計算巨大的矩陣集，但記憶時間不夠長。每次進行計算時，它們都會存取記憶體芯片來記錄結果或召回下一任務。「存取記憶體的次數越多，在功耗和延遲方面的成本就越高，」Sakyasingha Dasgupta表示。芯片還需要額外的功率來彌補存取記憶體導致的延遲，從而導致設計更加龐大且能效更低。

Edgecortix的芯片設計使其能夠以更流線型的方式處理數據，從而減少芯片存取記憶體的次數。這種方法使該公司避免使用強大 但 昂貴的HBM芯片。

Edgecortix表示，其芯片專為「受限環境」中的AI套用設計，例如裝置或工業機器，其執行所需的功率僅為GPU的十分之一，卻能提供相同的效能。

Cerebras Systems

Cerebras Systems成立於2015年，是一家希望在AI計算領域挑戰輝達的初創公司，該公司推出了一款新款巨型芯片CS-3，稱其將在執行AI模型和生成式響應方面擊敗競爭對手。Cerebras還為AI開發人員推出了一款工具，允許他們存取超大芯片來執行應用程式。

Cerebras的方法依賴於由單個矽片制成的巨型芯片，其每個芯片大小與餐盤相當，被稱為晶圓級芯片，從而避免了AI數據處理的一個問題：為AI套用提供支持的大型模型處理的數據通常無法放在單個芯片上，可能需要數百或數千個芯片串聯在一起。

Cerebras表示，這種新技術使芯片比傳統芯片更強大。但該公司必須提供專門設計用於容納超大芯片的電腦，因為傳統硬體無法容納它們。另外該芯片還采用內建記憶體的方式加快資訊傳遞速度。

Cerebras聲稱，其解決方案在AI推理方面比輝達當前一代Hopper芯片快20倍，而價格僅為後者的一小部份。

Cerebras正在建立自己的數據中心，以提供AI計算服務。它還試圖將其芯片出售給雲提供商。當被問及Cerebras能從輝達手中奪走多少市場份額時，Andrew Feldman表示：「足以讓他們感到憤怒。」

d-Matrix

d-Matrix由Sid Sheth於2019年創立，此前在新加坡國有基金淡馬錫領投B輪融資中籌集1.1億美元。Sid Sheth表示，該公司計劃在今年晚些時候或明年初籌集2億美元或更多資金。

d-Matrix設計的芯片經過最佳化，可幫助為生成式AI套用提供支持。該公司芯片具有數位「記憶體計算」功能，使AI電腦程式碼能夠更有效地執行。公司芯片技術使用更少的資源來處理生成式AI響應所需的數據，並且針對此類任務進行了最佳化。

d-Matrix計劃在今年底全面推出自己的芯片平台Corsair。Sid Sheth表示，該公司正在將其產品與Triton等開放軟體配對，Triton與輝達CUDA競爭。CUDA是一個廣泛使用的軟體平台，為開發人員提供構建AI應用程式的工具並最佳化其芯片的效能。

Groq

AI初創公司Groq成立於2016年，在今年8月初表示，在由思科投資、三星催化基金和貝萊德私募股權合夥人等領投的D輪融資中籌集6.4億美元，其估值已達到28億美元。

這家矽谷公司由Alphabet前工程師創立，專門生產AI推理芯片，這是一種最佳化速度並執行預訓練模型命令的半導體。

去年，Groq適配了Meta的大型語言模型LLaMA，使其能夠在自己的芯片上執行，而無需輝達的芯片。Meta研究人員使用輝達的芯片構建了LLaMA。

SK電信與Rebellions合並

今年8月18日，SK電信的AI芯片部門Sapeon Korea與半導體初創公司Rebellions正式簽署合並協定。此次合並預計將形成一個價值超過7.4億美元的新實體。

AI初創公司Rebellions成立於2020年，曾於2023年推出其首款NPU芯片Atom，也是南韓本土開發的首款用於數據中心大語言模型（LLM）的NPU，並於今年投入量產。而Sapeon公司成立於2022年，於2023年11月釋出了新一代X330 AI芯片，同樣面向數據中心，采用台積電7nm制程工藝制造。X330芯片有兩種型號：X330 Compact擁有367TFLOPs的計算能力、整合16GB記憶體；X330 Prime擁有734TFLOPs算力，整合32GB記憶體。

據悉，Rebellions將於今年底前開始量產AI芯片「Rebel Quad」，該產品配備4個三星12層HBM3E芯片，記憶體達144GB。Rebel芯片是繼上一代Atom之後開發的新一代AI數據中心芯片。

合並後的公司將尋求透過NPU獲得強勢地位，Rebellions將負責管理合並後的實體。手握三星與SK兩大南韓財團，新公司的目標也非常明確：挑戰全球AI芯片領導者輝達，在全球AI芯片市場占據一席之地。

Tenstorrent

曾為英特爾、AMD和特斯拉工作的芯片設計師Jim Keller正試圖透過設計比輝達更高效的芯片來降低AI套用的價格，以期奪取輝達GPU的部份市場份額。Jim Keller現在是美國設計AI芯片初創公司Tenstorrent CEO。

Tenstorrent成立於2016年，正準備在2024年底出售其第二代多用途AI芯片。該公司表示，在某些領域，它擁有比輝達的AI GPU更好的能效和處理效率。據稱，其Galaxy系統比輝達的DGX（AI伺服器）效率高出三倍，價格便宜33%，原因是該公司不打算使用HBM。

Tentorrent芯片主要特點是其100多個內核中的每個內核都有小型CPU，即「大腦中的大腦」，內核將能夠自行「思考」，決定先處理哪些數據，或者是否放棄某些被認為不必要的任務，從而提高整體效率。

Etched

人工智慧（AI）初創公司Etched由Gavin Uberti和Chris Zhu於2022年創立，公司已招募曾在Cypress半導體和博通等公司工作過的人員進行研發。公司旨在制造一種專用芯片，用於執行廣泛使用的AI模型。該公司宣稱其芯片將與輝達的產品相媲美。

Etched工程師正在設計第一款AI芯片Sohu，為生成內容和響應的AI計算部份（稱為推理）提供支持，將經過最佳化以執行特定形式的「transformer」AI模型。

Etched表示，Sohu AI芯片支持Alphabet旗下谷歌、Meta、微軟、OpenAI和Anthropic的所有流行transformer，並且可以處理對未來模型的調整。Etched已與台積電合作制造芯片。

除了AI芯片創企外，一些老牌科技和半導體巨頭也在開疆擴土，以期在輝達主導的GPU市場開啟一扇大門，搶占一席之地。

AMD

為了全面追擊輝達，AMD的並購之路「再下一城」。繼7月收購歐洲最大的私人AI實驗室Silo AI後，AMD近日再以49億美元並購全球最大的超大規模計算公司AI基礎設施提供商ZT Systems。這次AMD有史以來的第二大交易，不僅標誌其AI投資全面完成，也標誌著其構建起全機架系統軟硬體設計和銷售的綜合生態，即基於跨芯片、軟體和系統的創新提供領先的AI訓練和推理解決方案。

同時，透過此次交易，AMD將能夠更好地與主要對手輝達競爭，尤其是在HPC（高效能計算）和AI訓練集群的設計和客製方面，進一步鞏固其在數據中心市場的地位。

Arm

英國芯片設計巨頭Arm正在以色列開發一款GPU，將與輝達展開競爭。據估計，Arm在其位於拉阿納納開發中心的全球圖形處理小組中雇用大約100名芯片和軟體開發工程師。

報道稱，Arm新款GPU開發主要側重於遊戲市場。不過，如果其研究成果轉化為實際產品，也不排除這種開發將套用於AI處理。

Arm位於以色列的硬體團隊負責這些GPU的許多元件開發，包括旗艦產品Immortalis GPU，而以色列軟體團隊則為大型公司和新創公司的遊戲開發商開發外部圖形引擎開發商的軟體介面，包括Vulkan和OpenGL。Arm以色列辦公室也負責軟體開發和開發工具、保護芯片活動的網路安全元件，以及與Arm合作的以色列芯片公司的銷售和服務團隊。

還有訊息稱，Arm計劃推出用於自家伺服器的AI處理器，與輝達競爭。

亞馬遜

亞馬遜在位於德克薩斯州奧斯丁的一家芯片實驗室裏，對一款受到嚴密保護的新型伺服器設計進行了測試。該伺服器配備亞馬遜AI芯片，與市場領導者輝達的芯片競爭。

亞馬遜正在開發自己的處理器，以限制對輝達昂貴芯片的依賴，該芯片為其亞馬遜AWS的部份AI雲業務提供支持。

亞馬遜希望透過自主研發的芯片幫助客戶以更低的成本進行復雜的計算並處理大量數據。亞馬遜AWS表示：「在某些情況下，效能可提高40%甚至50%，因此成本應該是使用輝達芯片的一半。」

最後

隨著隨著AI技術的發展與普及，行業對高效能、低功耗的AI芯片的需求不斷增加，全球半導體企業將繼續在該領域展開激烈角逐。

風險投資公司Lux Capital聯合創始人兼執行合夥人Peter Hébert表示：「公眾投資者一直渴望找到並支持下一個‘輝達’。這不僅僅是追逐最新趨勢。這種勢頭也使幾家風投資助的芯片初創公司受益，這些公司已經努力了近十年。」

Omdia咨詢總監Kazuhiro Sugiyama估計，輝達將在AI芯片總市場中繼續占據30%~40%的份額，這主要得益於其在訓練領域的主導地位，留給初創企業的則是更為利基的市場。如果行業對AI計算的方法發生根本性變化，「GPU的統治地位可能會終結」。

（校對/張傑）