當前位置: 華文世界 > 科技

三大巨頭卡住AI命脈,輝達、台積電,還有一個是誰?

2024-08-28科技

輝達

核心的戰場是算力,無需質疑,算力的強大如同戰爭中的彈藥,多則強大,勝率更高。目前市場上提供AI算力的主要是輝達的GPU、AMD的GPU和谷歌的TPU,而輝達的GPU無疑擁有最強的火力。

GPU取代了CPU,在輝達的壟斷旅程中起到了關鍵作用。普通的CPU只能同時處理一個任務,相當於大腦在處理大量數據時容易混亂,而GPU則擁有眾多計算核心,能同時進行大量相似計算任務,這樣可以在很短時間內處理海量數據。此外,傳統CPU在訓練深度神經網路時效率低下,而GPU能平行計算,顯著縮短訓練時間,從幾十天縮短到幾小時。

但你可能對GPU這個名詞感到陌生,GPU的全稱是Graphics Processing Unit,即圖形處理單元。但說到顯卡,你應該更熟悉一些,GPU正是顯卡的核心組成部份。

GPU這個概念最初由輝達在1999年提出,後來英特爾和AMD也將其整合進主機板,再整合到CPU中,在筆記本和個人電腦市場大獲成功,二者因此聲名大噪。相比之下,輝達一直專註於獨立顯卡的制作,在電子遊戲的興起後才真正開始發揮其強大作用。

但真正的轉變發生在2022年底,當OpenAI釋出ChatGPT時,人們開始意識到算力和並列處理能力在深度學習和推理任務中的重要性,輝達的GPU加速卡的效果堪比原子彈,其股價也迅速升至微軟、蘋果之後的第三位,且差距逐漸縮小,看似有望挑戰第一。

盡管輝達並非唯一制造GPU的公司,AMD也生產GPU,谷歌則開發了專為深度學習設計的TPU,即張量處理單元。但為什麽歷史的幸運兒會是輝達呢?

與一般CPU的幾個核心不同,GPU擁有成百上千甚至成千上萬個計算核心,但僅有核心還不夠,還需要組織這些核心以發揮其功能。輝達因此開發了CUDA技術,這是一種平行計算平台和編程模型,使得開發者能夠利用輝達的GPU進行高效能計算。而關鍵並非僅僅是CUDA技術,而是輝達圍繞該技術建立的包括深度學習和平行計算庫、編譯器、偵錯工具及效能最佳化工具的全面生態系,這大大降低了開發和訓練AI模型的門檻,吸引了眾多研究者和開發者。這就如同微軟在電腦上的Windows系統,蘋果和谷歌在智慧型手機上的iOS和Android系統,把使用者、開發者與自身緊密繫結。

反觀AMD,盡管其GPU效能也不錯,但在AI和深度學習領域的軟體及生態系建設上相對滯後。AMD推出了開源的ROCm高效能計算平台,但與輝達的CUDA相比,其生態系成熟度和支持程度較低,社群和資源不如輝達豐富,這在一定程度上限制了AMD在AI大模型訓練領域的競爭力。因此AMD常常處於弱勢,無論是在CPU領域的競爭中輸給英特爾,還是在GPU領域敗給輝達,都顯得頗為無奈。

谷歌的TPU則是專為深度學習任務設計的,其效能在某些特定任務上可能超越GPU,但TPU主要透過谷歌雲服務提供,這限制了其套用的靈活性和普及度。盡管TPU在效率和效能上具有優勢,但與輝達GPU的廣泛可用性和成本效益相比,仍有不小的劣勢。

接著,輝達不斷推出新一代的GPU加速卡,如A100、p00、p00至最新的B100,每一代都在效能上實作了革命性提升,讓競爭對手難以追趕,不斷地鞏固其市場的壟斷地位,市場似乎也預設了這一點。

台積電

因此,你可以看到輝達的壟斷源自其數十年如一日的專註和持續。而台積電,同樣壟斷AI核心的另一家公司,將這種專註和持續發揮到了極致。台積電專門從事芯片代工,不與上遊芯片設計企業競爭,因此廣受歡迎,安全可靠地代工芯片,從而壟斷了全球中低端芯片的60%,幾乎全部的高端先進芯片。

最關鍵的不僅是高精尖的芯片生產機器,還包括操作技術和供應鏈管理。台積電專註於芯片代工幾十年,積累了豐富的技術經驗,建立了龐大的芯片制造「生態系」,表現在生產上,即良品率更高,成本更低,從而形成了絕對的壟斷地位,穩固地卡在芯片領域的中間,穩穩地獲得高額利潤。

其中最值得一提的是CoWoS封裝技術。前文提到,輝達p00售價35000美元一個,其成本約為3000美元,其中台積電賺取約900美元。你可能會認為,這種高級芯片目前只有台積電能生產,自然利潤頗豐。但你可能不知道的是,台積電生產這顆芯片實際只能賺到155美元,真正賺錢的其實是芯片封裝過程,憑借其獨家的CoWoS封裝技術,台積電在每個p00加速卡上能賺取723美元,遠超芯片生產的收入。目前5奈米的p00,盡管其他廠家也許能生產,但封裝卻只有台積電能做到。

這所謂的CoWoS,即Chip on Wafer on Substrate,意為芯片堆疊到晶圓到基板上。這是一種復雜的「2.5D」封裝技術,台積電早在2013年就已研發成功,可以將多個半導體芯片,包括處理器和記憶體,整合到一個矽中介層上,然後連線到底層基板上,這樣可以縮短芯片間的連線路線,減少芯片間的通訊距離,從而降低數據傳輸延遲,提高整體效能,並在一定程度上降低能耗。

此外,將記憶體直接整合到GPU旁邊,可以顯著提升數據傳輸頻寬,這對於需要處理大量數據的套用,如人工智慧、高效能計算尤為重要。事實上,由於CoWoS的高成本,這項技術長期未被市場接受,直到2016年輝達推出首款CoWoS封裝芯片GP100,才真正引領了全球人工智慧的潮流,使CoWoS技術大放異彩,成為台積電壟斷的重要武器。

因此,台積電壟斷AI核心的關鍵,不僅僅是其先進的芯片生產能力,更是其無與倫比的CoWoS封裝技術。你不能因為台積電的高收費而責怪它,因為CoWoS的精確要求極高,制造過程復雜,生產芯片的周期長,因此生產成本也非常高。

至此,你或許已經迫不及待地想知道,輝達p00的成本3000美元,那麽另外2000美元究竟流向了哪裏?好了,壟斷AI命脈的第三大巨頭現在登場,雖然其壟斷地位可能岌岌可危,但最終,利潤還是落入了這家公司的口袋,這又是怎麽一回事呢?

海麗仕

前文已述,輝達p00的關鍵之一在於將記憶體整合到GPU旁邊,這大大提升了數據傳輸頻寬,這些記憶體,正是額外2000美元成本中的一部份,來自南韓的SK海麗仕,這也是壟斷AI命脈的第三大巨頭。

所謂的記憶體,就是我們通常所說的記憶體,這是電腦和手機中最重要的三大元件之一,其余兩個是處理器(芯片)和硬碟。現在輝達將芯片和記憶體一起整合成加速卡,使其更適合AI訓練,p00目前使用的是海麗仕最新的HBM3E(高頻寬記憶體),這是一種高效能的DRAM。

DRAM和主控芯片一樣,對智慧裝置的執行速度具有決定性作用,HBM是DRAM的一種3D堆疊版本,可以在增加頻寬的同時,實作芯片間的高速通訊和低能耗,對AI大模型來說,可以說是如虎添翼,尤其是將其與GPU近距離封裝在一起,更是形成了強強聯合,所向披靡。

然而,HBM的設計和制造極為復雜,需要透過垂直堆疊、制造矽孔(TSV)和微凸點連線等高精尖技術和復雜工藝整合到矽中介層上,最先進的DRAM甚至需要使用EUV光刻機來制造,再加上專利壁壘和高研發成本,HBM已基本被南韓的海麗仕、三星和美國的美光壟斷。根據半導體研究機構SemiAnalysis的最新預測,海麗仕目前的HBM市場份額約為73%,三星為22%,美光為5%。

那麽為什麽海麗仕能夠壟斷HBM呢?答案仍然是堅持!2013年,海麗仕制造出第一個HBM並設立了行業標準,但由於價格昂貴,市場長時間不認可,客戶寥寥無幾。但海麗仕始終堅持不懈,多年來進行了三次技術升級,最終在這輪AI浪潮中一舉成名,2024年的所有產能已被預訂一空,其股價也翻了一番。

盡管三星憑借自己的晶圓廠和DRAM的深厚積累努力追趕,可能會擴大自己的市場份額,但海麗仕的壟斷地位可能難以持久,盡管如此,利潤最終還是會流向南韓。業界預計到2030年,HBM市場將增長10倍達到500億美元,海麗仕仍可能占據一半以上的份額。

因此,壟斷AI命脈的三大巨頭——輝達、台積電、海麗仕,都是憑借提前布局,十年隱忍,厚積薄發,最終實作了一飛沖天的壯舉。如果是短視的、輕易放棄的,明明有從0到1的突破,卻無法堅持到底,也就無法在今日這般「仰天大笑出門去,我輩豈是蓬蒿人」。

想想看,你有沒有堅持了十年的事物?如果有,也許你也即將嘗到成功的甘甜——堅持便是勝利!