當前位置: 華文世界 > 科技

這一次,國產光計算芯片走到了商業化的臨界點

2024-07-22科技

光計算芯片行業的水溫,正在發生變化。

作者|八度

編輯|王博

「整合光路將是半導體領域60年一遇的‘換道超車’。」

去年底,在2023全球硬科技創新大會上釋出的【光子時代:光子產業發展白皮書】前言的最後一段,有著這樣一句話。

光計算芯片在算力、數據傳輸上的優勢毋庸置疑,國內團隊的研究成果也時常見諸報端,但一提到規模化商用,不少人仍心存疑慮。2023年,一位從事微納光子器件科研的研究生在知乎上發帖討論光計算芯片相關問題時就直白地說:「既然沒有商用,肯定是還有很大問題的。」

那麽,光計算芯片從論文裏走出來了嗎?

矩陣規模(算力密度)和單節點光辨識度(算力精度)是衡量光計算芯片效能的關鍵指標,業內公認的達到商用標準的矩陣規模是128×128,2021年全球範圍內有兩家企業完成了64×64的光計算芯片流片,此後三年內這個瓶頸一直沒有被突破,有的企業甚至轉戰了其它賽道。

而在近期舉行的2024世界人工智慧大會(WAIC)期間,「甲子光年」了解到,國內光計算芯片公司光本位科技已完成首顆算力密度和算力精度均達到商用標準的光計算芯片流片,這顆芯片的矩陣規模為128×128,峰值算力超1700TOPS。

光本位科技研發的矩陣規模為128×128的光計算芯片,圖片來源:光本位科技

「我們目前對標的就是輝達A100,」光本位科技聯合創始人程唐盛告訴「甲子光年」,「128×128芯片將被制作成板卡,其最終形成的算力將與輝達的電子芯片產品具有可比性。同時,我們的初代產品功耗大約是它們的十分之一到十五分之一。此外,在延時方面,光計算芯片也會有數量級的降低。」

128×128的矩陣規模,意味著國產光計算芯片離產業化更近一步,而不僅僅是「停留在紙面上」「只生活在實驗室裏」。

光本位科技創始人熊胤江表示,公司正在進行128×128光計算板卡偵錯,預計將於2025年內推出商業化光計算板卡產品,用更高的能效比、更大的算力賦能大模型、AI算力硬體、智算中心、具身智慧等產業,同時公司即將完成更大矩陣規模的光計算芯片研發。

「我認為目前可能正處於一個臨界點上,」一位關註芯片行業投資人告訴「甲子光年」,「大家已經從最初認為光計算芯片完全無法實作的態度,轉而認為它有可能實作。」

光計算芯片行業的水溫,正在發生變化。

1.「你相信光嗎?」

「你相信光嗎?」

這一句網路流行語,也是光計算芯片行業的真實寫照。

在過去的50多年裏,芯片的算力一直遵循著莫耳定律持續增長。以往,行業更習慣采用的是電芯片算力,但當下電芯片的算力正面臨增長瓶頸。

比如,量子穿隧效應限制了晶體管尺寸的進一步縮小;隨著效能增長,能量消耗和熱量積累對芯片的散熱提出了更高要求;訊號延遲,芯片內部傳輸速度和數據傳輸瓶頸限制了處理速度;可延伸性問題,現有技術框架下晶體管數量接近上限。

供給面臨瓶頸,而需求仍在增加。莫耳執行緒創始人兼執行長張建中今年5月在「甲子光年」舉辦的「AI創生時代——2024甲子重力X科技產業新風向」大會上直言:「大多數AI創業公司即使融到了數十億或數億資金,也難以建立算力中心。再加上算力資源的稀缺,使得許多企業心有余而力不足。包括OpenAI在內的整個行業面臨的問題是如何解決算力資源匱乏導致的叠代難題。」

如何破局?光計算芯片提供了一種新的思路。

光計算芯片是光子芯片的一種套用形式,專註於計算任務的光學實作,具有超高速度、超強並列性、超高頻寬和超低損耗的特點。

其實幾十年來,科學家們對光的探索,從未停止。在20世紀40年代,傅立葉變換被引入光學中,發展出傅立葉光學。1980年至2004年是光計算的黃金年代,在此期間,科研人員提出了大量光計算技術,包括光學模式辨識、邏輯光計算、光學神經網路、光互連和光學全像儲存等。

但是,由於對光計算的套用需求和套用場景不清晰,並且缺乏與之相匹配的光學硬體體系,此前光計算技術的發展比較緩慢。

近幾年,隨著人工智慧產業的爆發,光計算芯片也進入了快速發展期。

2021年,全球光子產品總及相關服務的估值則高達7萬億美元以上,約占全球世界經濟總量的11%。

而現在,光計算作為一個專業涉及面廣、理論和技術要求極高的新興產業,被視為中國與國際競爭對手站在同一起跑線上,甚至能夠實作技術超越的潛在領域。

2.128×128:算力與功耗的雙重突破

盡管光計算芯片被寄予厚望,但過去很長時間裏,光計算是一項被困在實驗室的技術。

2017年,光計算領域出現了第一篇Nature文章,之後一些公司陸續成立。然而,整個產業鏈還不夠成熟,從封裝到電芯片配合方面都沒有太多可參考的範例。到了2022年,光本位科技成立的那一年,行業經過五年的發展,技術和產業鏈逐漸成熟,但光計算芯片還是沒有像傳統電芯片那樣大規模商業化。

熊胤江認為這主要有兩個維度的原因:一是過去光計算芯片本身設計的不成熟,無法與現階段領先的電方案直接對比;二是將其落地成產品的產業鏈不成熟,光電融合歸根到底還是非常有挑戰的工程化工作。

「國內很多高校裏的光計算芯片都是3×3或是4×4這種更小規模,一些初創公司,也最多只能做到64×64,這代表它並沒有具備商業化能力,還在研發階段。」峰瑞資本早期計畫負責人李罡告訴「甲子光年」。

而這一次,光本位科技的這顆矩陣規模為128×128的光計算芯片成功流片,意味著國產光計算芯片走到了商業化的臨界點。

要實作規模化商用,光計算芯片需解決非線性計算、存算一體等難題,無論是科研院所,還是產業界,都認為構建光電融合生態是一條必經之路。光本位科技基於PCM相變材料實作了存算一體的存內計算,儲存單元與計算單元完全融合,目前已叠代出以光計算芯片為核心的電芯片設計能力,並與國內頂尖封裝公司建立深度戰略合作,共同開發先進光電合封能力。

「128×128矩陣規模可以與谷歌的TPU或是華為的昇騰等采用的架構相媲美。對我們來說,光計算在算力密度和矩陣規模上已經等同於電子計算,這是以前光計算未能實作的,而我們首次做到了。」熊胤江說。

光本位科技的光子存算一體原型機,圖片來源:光本位科技

光計算芯片的矩陣規模對應的就是算力。

例如,從64×64矩陣規模提升到128×128矩陣規模,算力至少增加了四倍,但功耗的增加是線性的。

具體來說,在64×64矩陣規模時,芯片配備了64個模數轉換器(ADC)和64個數模轉換器(DAC)。當矩陣規模到了128×128時,雖然算力提升了四倍,但所需的ADC和DAC數量僅增加到原來的兩倍,這意味著算力效率至少提升了一倍。

同時,這款光計算芯片的精度也實作突破,達到了AI推理的標準精度。

更為重要的是,128×128矩陣中的每個單元都是可調的,這使得該芯片成為一個完全通用的平台,能夠處理任何型別的AI計算任務,這一點與之前固定權重、只能處理單一套用的其它光計算芯片形成了鮮明對比。

這樣的技術突破並非一蹴而就,而是十年技術積累的結晶。

2014年開始,牛津實驗室就開創了相變材料與矽光結合的研發,2017年成功研發全球第一個光子存算一體芯片。在牛津大學讀博士期間,程唐盛師從全球「相變材料光計算」第一人——牛津大學材料系教授、英國皇家工程院院士Harish Bhaskaran,他還主導、參與了牛津大學的相變材料光計算芯片、新型超低功耗奈米相變材料的研發。

程唐盛告訴「甲子光年」,從在牛津讀博士開始,他多年來一直著手解決光計算技術在實際套用中的問題,研究如何降低功耗和擴大規模,以期滿足人工智慧發展等套用對算力的需求。

光本位科技創始團隊在光計算領域不斷突破。2022年創業,更是「有備而來」。

「從公司成立之初,我們就已經意識到市場上現有的光計算芯片矩陣規模較小,這限制了它們的算力密度和算力規模。因此,從公司成立的第一天起,我們就明確了首先要將矩陣規模從64×64提升至128×128,然後進一步擴充套件至256×256,以及512×512。」程唐盛告訴「甲子光年」。

去年,光本位科技利用前代的光計算芯片,完成了板卡架構的完整執行,包括封裝、與電芯片結合,並執行了通用AI網路如ResNet-50等。

今年,光本位科技進一步最佳化芯片,一方面是提升矩陣規模至128×128,以提高算力密度和算力規模;另一方面,針對每個獨立的光器件進行最佳化、仿真,並進行針對性的流片,以實作整個系統的全面最佳化。

「我們基本上每三個月到半年會進行一次流片。我認為只有將產品迅速做出來,並且不斷叠代,公司才是真正的穩健。」熊胤江說。

這一次128×128光計算芯片,正是由前3次的產品叠代而來。

那麽,這樣的光計算芯片產品的商用場景在哪裏?

3.光計算芯片被誰需要?

對於套用層來說,光計算芯片將為它們提供更高算力和更低功耗的支撐。

更高算力,意味著光計算芯片可以處理更復雜的模型,更復雜的模型則可以催生更好的套用;更低功耗,意味著無論是在訓練模型時的成本,還是使用者在實際使用時的推理成本,都會在很大程度上降低。一旦光計算芯片被商用,將是後莫耳時代的一道曙光,形成一種良性迴圈。

技術套用的每次變革都源於算力的突破。正是算力的提升,人工智慧的顛覆性時刻才得以出現。

所以光計算芯片的首要場景,就是人工智慧。「當下人工智慧快速發展,這一場景的套用和需求變得非常明確。光計算芯片能夠針對當前的大型模型相關套用快速進行適配和最佳化。」李罡說。

在大模型領域,光計算將幫助下遊客戶降低成本、提高效率。它可以使得未來推理成本降至現在的千分之一或萬分之一,使使用者在存取大模型時幾乎無成本,從而顯著提高大模型公司的毛利率。

算力成本的降低對於大模型套用落地非常重要,否則企業將不得不每天都頭疼開銷,從而減小模型規模,降低訓練品質。

一位人工智慧初創企業的創始人告訴「甲子光年」,算力成本降低會有助於套用產品的發展,「我覺得現在大家應該逐漸更加清晰地想明白token是消耗越多越好,而不是想辦法盡量做一個節省token的套用。」

同時,光計算芯片算力的大幅提升,也能夠為當前人工智慧、大數據分析、自動駕駛等熱門技術場景提供強大的動力。

熊胤江介紹,在自動駕駛領域,目前L3級別的算力在200-500TOPS,而要達到L5級別,預計需要2000TOPS以上的算力。如果基於現有技術,功耗將在2kW以上,這對於新能源智慧駕駛汽車的續航能力是一個挑戰。

因此,必須尋找一種低功耗、高算力的解決方案,而光計算芯片,恰好能夠滿足這一需求。

而對於當下火熱的具身智慧來說,光計算芯片能夠在端側進行大量計算,並且不需要消耗過多能量,使機器人在保持「高智商」的同時,還能進行大量機械操作。

如果具身智慧要達到通用人工智慧(AGI)的能力和認知力,所需的算力將遠超現有水平。光計算芯片的高算力潛力,將使具身智慧能夠獨立思考,甚至可能具備超越人類的思維邏輯和判斷能力,這將是光計算技術的終極潛力所在。

不可否認,光計算芯片以其超高速、高能效的特性,未來一定還會催生出全新的演算法範式,從而推動整個計算科學領域的進步和創新。

4.「左手釘子、右手錘子」的產業化之路

隨著128×128矩陣規模光計算芯片流片,未來兩年,將是光計算芯片工程化的關鍵時期。也就是說,光計算芯片要真正開始接受「真實而復雜」的場景考驗。

「2025年,將是光本位科技的突破年,屆時光計算芯片將進入商業化元年,光本位科技將與下遊大規模接觸並適配,建立商業合作關系。2026年,光計算芯片有望實作大規模出貨。」熊胤江預測。

他告訴「甲子光年」,光本位科技的發展遵循T字形戰略,縱向上,深入產品周期,從芯片到板卡,再到下遊適配和最終出貨。今年下半年電子芯片也會完成流片,團隊將進行封裝測試,完成2.5D和3D的光電合封,最終將形成光子計算板卡,並交付給客戶適配,同時構建軟體生態系。

橫向上,光本位科技將拓寬光計算領域的研發壁壘,進行更大矩陣規模的研發,包括但不限於256×256、512×512矩陣規模的光計算芯片研發,並利用波長分波多工等先進技術。

「這T字形戰略既有縱深,確保產品不是空中樓閣,能夠深入到使用者層面;同時,也確保我們能夠一直保持研發的領先地位。」熊胤江告訴「甲子光年」。

光本位科技的光計算芯片執行原理圖,圖片來源:光本位科技

光本位科技將研發能力視為「錘子」,將市場需求視為「釘子」。既要技術的不斷叠代,也要使用者需求的持續反饋。

若要兩者在中間相遇,左手市場、右手研發都需要投入。

在科研層面,光本位科技與復旦大學成立了未來計算硬體聯合實驗室,探索光計算在技術發散時期的所有可能性。

在工程化落地方面,團隊集結了模擬、數位、硬體、系統架構和演算法等領域資深的「行業老兵」,確保產品能夠實作實際的工程化落地。

同時,公司已經與國內產業鏈中的合作夥伴建立了聯系,包括與國內領先的矽光企業聯合微電子進行戰略合作,以及與國內頂尖的封裝測試廠進行2.5D和3D光電封裝的前沿研發。

技術突破只是一個敲門磚,接下來對光計算芯片和光本位科技來說,要面臨的是產業生態的挑戰。

目前,市場客戶普遍使用的是輝達或其他熟悉的GPU,要實作光計算板卡的廣泛套用,需要與客戶進行適配。「我們努力的方向是確保光計算板卡在硬體上完全相容現有生態。」程唐盛說。

當然,光計算芯片和電芯片並不是替代關系,而是相互增強。

在初期發展階段,光計算芯片可能會扮演張量計算核心的角色,輔助傳統的電子芯片。鑒於目前電子芯片在市場上的主導地位,光計算芯片將首先承擔起人工智慧套用中的大量線性運算任務。

但隨著客戶需求的逐漸豐富,整個軟體生態系隨之豐富,各個光計算公司的交付能力也將有所提升。

程唐盛把當下光計算芯片的發展類比於「AlphaGo問世前夕」。與人工智慧或電子芯片平台相比,光計算還處於一個較前期的發展階段。隨著效率的提升和生態系的完善,光計算將逐漸發揮更大的作用,為智慧時代的計算、儲存、傳輸和感知提供強有力的技術支撐。

中科創星創始合夥人米磊在2016年曾提出過一個「米70定律」,他認為,光學技術會是未來一項非常關鍵的基礎技術,其成本會占到未來所有科技產品成本的70%。但不可否認的是,任何一種技術取得突破,都需要長期的積累和投入,以及更長時間的轉化和落地。

人類自誕生以來就受惠於光,而光也將為人工智慧創造更多可能。

*參考資料:

【27歲融資超億元!95後海歸創業者進軍光計算芯片】,甲子蘇州

(封面圖來源:「甲子光年」使用AI工具生成)