當前位置: 華文世界 > 科技

芯片供應瓶頸緩解,AI伺服器將迎出貨爆發期?

2024-07-18科技

大模型浪潮掀開了AI伺服器的商機。據市場研究機構TrendForce集邦咨詢7月17日的最新預測,AI伺服器2024年全年出貨量上調至167萬台,年增長率達41.5%。

這至少是集邦咨詢第二次上調出貨量預期。2023年10月,集邦咨詢估算2024年AI伺服器增長逾38%,今年1月將年增長率進一步調整至40%。

綜合多家分析機構和伺服器制造商的說法,AI伺服器出貨量的攀升,除了大模型競賽帶動的下遊客戶高需求,更得益於上遊芯片供應緊張狀況今年以來逐漸改善。

上下遊兩端助推出貨量攀升

和傳統的通用伺服器相比,AI伺服器具備強大的計算能力,因此「用武之地」就在AI訓練和推理過程中的數據計算。伺服器配置的計算資源上,AI伺服器往往搭配高效能CPU和GPU,而傳統伺服器通常不需要GPU。

大模型的訓練與推理業務,催生了對AI伺服器高漲的需求,AI伺服器也被稱為「大模型算力之源」。據市場機構IDC今年4月釋出的一份報告,2023全年中國AI伺服器市場規模達到94億美元,同比增長104%。TrendForce集邦咨詢分析師龔明德提供給南都記者的數據顯示,2023年全球AI伺服器的出貨量為118萬台,同比增長34.5%,占整體伺服器市場的8.8%。

2024年的出貨量占比和產值占比預計繼續攀升。集邦咨詢數據顯示,從全球伺服器市場的整體占比來看,AI伺服器占整體伺服器出貨的比重預估將達12.2%,較2023年提升約3.4個百分點。相比之下,通用伺服器出貨量年增長率僅有1.9%。以產值維度估算,全球AI伺服器產值將達1870億美元,增長率達69%,產值占整體伺服器高達65%。

圖片來源:東海證券研報

集邦咨詢分析稱,上下遊多重積極因素助推AI伺服器更強的市場表現:

從下遊需求側來看,大型雲廠商等對於AI伺服器的采購依舊旺盛。據龔明德介紹,北美的谷歌、微軟、AWS(亞馬遜雲)、Meta等雲服務廠商持續采購AI伺服器,這些公司的采購量大致占整體市場的近6成。

上遊芯片供應側方面,SK海力士、三星、美光三家DRAM儲存芯片大廠逐步擴產HBM(高頻寬記憶體)——HBM可以實作AI訓練所需的高頻寬和低功耗,提升數據處理速度,在伺服器中和GPU封裝在一起;此外,芯片封裝廠商台積電也在擴充CoWoS先進封裝技術生產線;其次,輝達p00 GPU的交貨前置時間,從先前動輒40-50周下降至不到16周。龔明德告訴南都記者,去年由於CoWoS和HBM等關鍵元件產能緊張,導致AI伺服器供應不足,部份訂單被延遲至2024年。

AI伺服器風口的玩家,除了浪潮、新華三、戴爾等伺服器品牌廠商,還包括富士康、廣達、英業達等ODM廠商(原始設計制造商)——ODM模式下,ODM廠商繞開品牌伺服器廠商,直接同客戶合作。此前,不少ODM廠商已給出AI伺服器業務線的樂觀營收預期。

富士康母公司鴻海集團董事長劉揚偉5月底在股東會上透露,今年鴻海AI伺服器營收有望增長超40%,占整體伺服器業務的比重達四成以上,而2023年該占比為三成,AI伺服器會「很快成為富士康下一個萬億營收產品」。

中國台灣廠商廣達則在5月中旬的業績說明會上表示,去年由於GPU供應受限,影響到AI伺服器實際出貨量。但今年隨著元件供應情況改善,預計下半年AI伺服器「有望迎來出貨爆發期」,AI伺服器的全年營收占整體伺服器業務的比重將超過五成。

市場機構TechInsights 6月下旬預測稱,到2028年,AI伺服器將占到整體伺服器市場份額的59%,即1610.7億美元,復合年增長率為49%。

GPU伺服器仍是主流,但份額被蠶食

據東海證券計算,AI芯片占AI伺服器成本約70%-75%,其中GPU是AI芯片的主流。集邦咨詢數據顯示,AI伺服器搭載的GPU供應商來源上,輝達、AMD和英特爾三分天下,輝達市場占比高達9成。

雖然AI伺服器最常見的是CPU+多塊GPU的硬件配置架構,但CPU+ASIC的架構模式正迎頭追趕。AISC即專用集成電路,為了某種特定需求而專門客製,廣泛套用於深度學習和人工智能領域。按終端功能不同,AISC包括谷歌研發的TPU芯片(張量處理器,專用於機器學習)、地平線科技設計的BPU芯片(大腦處理器),以及NPU芯片(神經網絡處理器)。

集邦咨詢觀測到,除了谷歌在2023年下半年就加速將自研的TPU匯入AI伺服器,北美的AWS(亞馬遜雲)、Meta等雲服務廠商亦持續擴大自研ASIC;另外,阿裏、百度、華為等中國本土的雲廠商也在積極擴大自主ASIC方案。這些因素促使搭載ASIC的AI伺服器占整體AI伺服器的比重,在2024年將提升至26%,而主流搭載GPU的AI伺服器占比則約71%。

龔明德解釋說,ASIC AI伺服器的主要需求或優勢在於,其能更好地滿足雲服務提供商對特定AI套用的需求,同時長期使用成本較低。

GPU伺服器份額被蠶食的走勢,在中國市場亦不例外。據上述IDC 4月釋出的報告,2023年,搭載GPU的AI伺服器占據92%的市場份額,達到87億美元;但ASIC等非GPU伺服器以同比49%的增速,占據了近8%的市場份額,超過7億美元。IDC預測到2028年,中國市場上,非GPU伺服器市場規模占比將超過33%。

采寫:南都見習記者 楊柳