台積電與輝達合作發力AI芯片,國產AI芯片或將顆粒無收?
5月26日,台積電從輝達獲得了一大筆用於5 nm制程芯片的緊急訂單,這意味著台積電的5 nm制程產能已經完全飽和。
據報道,此次搶購的訂單中包括了輝達的p00,A100,H800,A800以及其它人工智能圖形處理器。過去,通常只有蘋果一家會下急單,但如今,來自輝達的一大批訂單卻讓台積電既緊張又激動。
從2023年開始, Chat GPT迅速走紅,對人工智能芯片的需求急劇上升,輝達也處在了風口浪尖上。
然而遺憾的是,國內的人工智能芯片並沒有跟上輝達的腳步,無論是在設計還是生產上,都遠遠落後於輝達。為了推動人工智能產業的發展,國內公司不得不從輝達購買低端的芯片。
而現在,輝達的實力,已經非常強大了。國產 AI芯片真的無敵了嗎?
難道是輝達?(nvn?)在 GPU產業中處於領先地位?
就市值而言,輝達目前市值為9,632億美元,與貴州茅台、工商銀行、中國移動(China Mobile)、20億美元(China Telecom)以及寧德時代(寧德時代)(967億美元)加起來,分別為21.2億美元,工商銀行17.1億美元,中國移動(China Mobile Mobile)和20億美元(寧德時代)。
輝達已經超過了英特爾,台積電,三星,從市場價值上說,它是最大的集成電路企業。
輝達的市場占有率是多少?(nvn?)其市場份額分別為88%、90%為人工智能數據中心和80%以上的人工智能市場。
從這一點可以看出,隨著人工智能技術的飛速發展,輝達已經占據了很大的市場份額。
輝達的套用場景?(nvn?)GPU已經在人工智能,超算,量子加速,無人駕駛,互聯網,光刻等領域得到了廣泛的套用。
輝達的未來,將會是何等的輝煌?(nvn?)圖形處理單元的套用將會更廣泛地套用於生活的方方面面。
讓我們來看一看輝達的 AI芯片是如何的強大。
在2023年三月二十一日,輝達的 GTC開發會議上,黃仁勛用了76分鐘的時間介紹了一系列的新產品。
每個月只需要$37,000,企業就能建立他們自己的 ChatGPT。
對於那些尚未建立大型人工智能模型的企業而言,它們可以透過開放的 ChatGPT來訓練更多的模型。
這是一項挑戰,因為訓練 GPT所需的計算量非常大,大多數企業都沒有能力自行研發一款新的圖形處理器,也無法承擔高昂的費用。
為此,輝達釋出了一款名為 DGX雲端的人工智能服務,該服務由8塊A100芯片組成,可在雲中對 Chat GPT進行訓練,任何企業只需每月支付3.7美元的費用就可以使用該服務。
這使得企業能夠以租賃的形式參與到大規模人工智能模型的開發中,而不必為 IT資源發愁。
提供產生式人工智能的演算法
生成型人工智能允許機器根據演算法產生文本,影像,影片等內容,在新聞稿,廣告語,電子商務詳細資訊頁等方面有著廣泛的套用。
隨著影像和影片的加入,生成型人工智能得到了廣泛的套用。
基於此, NVIDIA公司釋出了L4服務平台,它在解碼,編碼,影片生成等方面都有明顯的優勢。測試結果顯示,L4處理器與傳統 CPU相比,效能提高了120倍左右,能耗降低了99%。
另外, NVIDIA公司也釋出了專為二維/三維影像而開發的L40平台。
想想看,如果能研發出一款自助出版軟件,它能將影片、文字、圖片合成效率提升10倍以上,並且能在2小時內輕松寫出10篇文章,那該有多好。
幫助芯片的發展
還有輝達呢?(nvn?)也公布了一種新的計算微影技術---輝達?(nvn?)使用2納米工藝制造的 cuLitho計算光刻庫。
芯片設計與加工過程中需要進行大量的運算,而隨著晶體管數目的增多以及芯片工藝的不斷簡化,傳統的 CPU運算變得越來越耗費時間。
用輝達做什麽?(nvn?)圖形處理器可以提高40倍的運算速度,極大地加速了芯片的設計與制造。
舉個例子,一個遮罩版本過去需要兩個星期,現在只需要8個小時。
這一解決方案已經吸引了芯片工業巨頭的註意,其中包括台積電,新思和 ASML。
在短短的76分鐘會議上,輝達推出了一系列功能強大的新產品,它們中的任何一種,都足以令其它集成電路制造商趕超10年以上。
輝達之所以能取得如此驚人的成績,其根源就是它對"算術"的掌握。
算術是人工智能時代不可或缺的一環,隨著數碼經濟與人工智能技術的飛速發展,算術必將成為未來經濟發展的基石。
據 IDC的一份報告顯示,計算能力每提升1個百分點,相關國家的數碼經濟增長率將分別為3.5%, GDP增長率為1.8%。
輝達現在占世界500大超級電腦70%的份額?(nvn?)圖形處理單元,目前最先進的超級電腦90%采用輝達?(nvn?)圖形處理器。沒有輝達的強大支持,人工智能模型也是不可能實作的。
所以,黃仁勛宣稱摩爾定律在過去的10年裏使效能提升了100倍。那麽輝達呢?(nvn?)圖形處理單元的效能提升了1百萬倍,摩爾定律也許在下一個十年內就會失效,但是黃氏定律不會。
根據"黃氏定律",在接下來的10年裏,輝達將使人工智能的效能提升100萬倍,從而使人工智能真正蘇醒過來。
老黃的底氣來自於p00芯片的強大。
p00采用台積電4 nm制程制程,以 Hopper架構為基礎,包含 CUDA核心18,432個, Tensor核心576個,二級緩存60 M。
該圖形處理器擁有800億個晶體管,總運算能力可達2000 TFLOPS,其運算能力提升3.2倍,綜合效能提升6倍。
此外,p00還具備動態加速功能,可以最佳化運算路徑,使運算能力提升7倍。
p00還具有3 TB/s的記憶體頻寬和5 TB/s的網絡速率,在數據吞吐量上也是出類拔萃的。
此外,p00還可將 GPU劃分為7個單元,每一個單元可同時執行不同的運算任務,可使單核處理器效能提升7倍以上。
它的價格是24萬盧比,相當於一輛很好的汽車。不過,對於專業人士而言,這個價格還算公道,畢竟名額有限,先來先得。
輝達擁有強大的圖形處理單元,它的未來是光明的。
在過去的幾十年裏,芯片產業是由英特爾統治的,輝達將在未來的幾十年裏占據主導地位。黃仁勛同時宣布,多虧了輝達,智能電話的時代已經來臨。
國產人工智能晶片發展到什麽程度了?
像百度,華為,360,騰訊這樣的國有企業都宣布要進入人工智能的領域,並且迅速開發出大規模的人工智能模型。但是,如果沒有一顆強大的運算芯片做後盾,就算是華為,想要在這片土地上興風作浪,也是難上加難。
幸好,晶嘉微,劍橋半導體,華仁科技,蘇源科技,漢柏半導體等,都在積極研發。
景嘉微的人工智能芯片,主要套用在軍工、工業等領域,因為運算能力的限制,還沒有涉足大模型的領域。
即便是華為,也不滿足於此,可見寒武紀在芯片方面的實力。
能和輝達p00一較高下的國產 AI芯片,就是耐火墻技術了。
上海華倫斯坦公司的BR100系列產品,在2022世界人工智能大會上,成為了中國領先的人工智能芯片。
BR100采用台積電7 nm制程工藝,單片運算能力可達一萬億次以上,這一效能已經超越了輝達的p00,打破了多個 GPU運算紀錄。
網上有些網誌比較了BR100和p00:
難道是輝達?(nvn?)p00采用台積電4 nm制程工藝,擁有800億個晶體管、16位元浮點運算能力、2000 T的8位元定點運算能力,在稀疏模式下更是成倍增長。
BR100具有1000 T以上的16位元浮點處理能力,以及2000 T以上的8位元定點處理能力,單個芯片的峰值處理能力可達 PFLOPS。從這一點上來說,BR100並不比p00差。
當然,運算力只是其中的一部份,具體如何運用,還要看實際情況。畢竟,人工智能的效能,視訊記憶體頻寬,互聯通訊的速度,能量消耗,以及生態因子都要考慮在內。
然而,到目前為止,尚未有數百個BR100上使用過大模型,所以也沒有真正的對比。
我問到沃倫科技公司,發現它是一個規模不大的新興公司,但是聚集了很多業界的精英。
焦國方在圖形處理器領域有30多年的工作經驗,曾就職於華為及高通。在華為時,他曾負責過紅魔作業系統的影像處理以及使用者介面系統架構;在高通,他擔任驍龍圖形處理單元的總設計師,參與了5代圖形處理器的研發與革新。
洪洲擁有超過20年的圖形處理器架構設計經驗,先後就職於輝達,兆芯,華為等公司,負責 Tesla體系結構及效能最佳化,並負責 CUDA體系結構的開發;目前,華為負責海思公司的圖形處理器芯片的研發。
唐先生是全球 EDA工具領先者,是一位人工智能集成電路設計師。
他在半導體領域有20多年的工作經驗,先後在海酷,三星, AMD等公司工作過 GPU SOC體系結構。
李欣榮先生是 AMD全球副總裁兼中國 R& D中心總經理,擁有豐富的 IC產品設計經驗。
徐淩傑就職於阿裏的雲端運算部門,三星, AMD以及輝達。
不難發現,在人才儲備方面,耐火墻技術有著明顯的優勢,但是無論是規模還是數量,都遠遠落後於輝達。
輝達目前擁有超過20,000名研發人員,且人數仍在迅速增加,這使輝達得以將更多資金用於招聘及保留 GPU方面的人才.
此外,這些曾經供職於輝達、 AMD和高通的工程師們,是否也有可能在研發過程中出現類似於「中芯和台積電官司」的"專利侵權"?
另一個基本的問題就是生產.
目前大陸中芯國際的工藝水平只有12 nm,而華仁科技已經完成了7 nm的升級,未來還會有5 nm、4 nm的制程。如果它的效能提高對輝達構成了威脅,那麽"華為事件"會再次發生嗎?
所以,雖然國產人工智能芯片已經設計得不錯,但是大規模生產和大規模套用才是最關鍵的一步。
結論摘要
隨著人工智能時代的到來,輝達憑借著強大的研發實力,以及台積電獨特的生產工藝,在運算能力上占據了絕對的優勢,成為了當之無愧的霸主。
在研發上,被輝達比下去,在生產上,被台積電比下去了,那麽國產的人工智能芯片廠商,會不會失敗呢?
未來,「仁科」與「中芯」能否在人工智能芯片領域取得突破性進展?