日本AI，失去的不止三十年

2024-05-09科技

日本AI，失去的不止三十年

案件回顧，2019年，有兩件事一直困擾著孫正義：軟銀的投資失敗，以及日本科技的落後。

面對媒體，孫正義痛心地說道，科技產業幾乎從日本消失了，我們正在成為一個被遺忘的國家。即將到來的AI革命，是日本重回牌桌最後的機會[1]。

隨著ChatGPT問世，孫正義的呼籲終於成為了共識。然而，正當日本舉國動員，準備一腳油門闖入賽道時，卻發現了一個尷尬的事實：

日本目前的AI研究，非常依賴隔壁鄰居為首的老外。

對此，RIKEN革新智慧綜合研究中心負責人杉山將，曾做過一筆統計。

RIKEN（理化學研究所）是日本唯一的國家級科研機構，頂級頭腦聚集地。湯川秀樹等日本諾獎得主，都曾在這兒搞過研究。然而，那些被AI頂會收錄的RIKEN論文，近一半的作者都隸屬於外國大學，其中約一半的人來自中國[2]。

本土無人可用，使得日本在生成式AI浪潮裏，始終處於失語狀態。

然而，如若回溯歷史，會發現日本也曾是個「AI超級大國」。

上世紀八九十年代，日本一度是深度學習的中心。楊立昆、余凱、林元慶、賈揚清等載入科技史冊的泰鬥級人物，都曾在日本的AI實驗室度過一段青蔥歲月。

曾經攥著一手王炸的日本，為何會邁向老無所依的結局？

站在日本人的肩膀上

上世紀80年代，正在讀大學的楊立昆，被一群「瘋子」吸引了。

彼時，深度學習是個「已被證偽」的技術路線。然而，仍有一小撮人在死磕，這其中就包括了一批日本科學家。楊立昆發現，當時大部份的深度學習論文，都是日本研究人員用英文寫的。

這其中，對他影響最大的，是一位名叫福島邦彥的日本人。

福島邦彥

1980年，福島邦彥參照貓的視覺結構，設計了一個叫做「神經認知機（Neocognitron）」的多層網絡模型。

在生物的初級視覺皮層中，存在多個神經元，每個神經元只「掌管」一小部份視野。隨後，神經元收集到的資訊會統一傳輸到視覺皮層，組合成完整的視覺影像。

受此啟發，福島邦彥給神經認知機設計了「感知光照「和「運動資訊」兩個神經元，分別用來「提取圖形資訊」和「組成圖形資訊」。然而，福島邦彥的神經認知機，存在一個致命問題：太超前了。

當時，主流的神經網絡只有1層，但神經認知機有足足5層。

面對多層設計帶來的種種問題，福島邦彥一時找不到解決辦法，導致神經認知機只能處理一些極其簡單的工作。

直到1986年，辛頓提出了「反向傳播演算法」，這個問題才有了標準答案。

但若向前追溯反向傳播演算法，會發現其源頭仍是日本人。上世紀60年代，日本數學家甘利俊一提出的「隨機梯度下降方法」，為其提供了技術靈感[6]。只不過囿於特定時代的局限，甘利俊一沒有條件在電腦上進行模擬驗證。

1988年，楊立昆將神經認知機與反向傳播結合在一起，打造出了大名鼎鼎的摺積神經網絡。直到今天，摺積神經網絡仍是影像辨識領域最重要的演算法之一。

由此可見，這些定義一個時代的AI研究成果，都是站在日本科學家肩膀上實作的。

實驗室裏的中國人

同一時期，日本的產業界，拉開了更為激進的歷史篇章。

彼時，日本步入極度繁榮的泡沫經濟時代。大型企業紛紛為愛發電，自掏腰包搭建中央實驗室，發力基礎科學。這其中，要數NEC（日本電器股份有限公司）最為激進：它直接切入美國科技產業腹地，將實驗室開到了普林斯頓和矽谷。

財大氣粗的NEC Lab，很快聚集了一大批日後響當當的名字。

西安交大軟件學院院長、國家特聘教授龔怡宏，是第一個加入矽谷NEC Lab的國人科學家。在他擔任實驗室主任時期，延攬了一眾青年才俊。

其中既有觸發科技巨頭競拍辛頓的余凱，也有林元慶、徐偉等活躍在中國AI產業一線的技術大牛。

余凱

彼時，中國的電腦產業剛剛起步，吸納不了那麽多人才。矽谷NEC Lab無縫承接了這個需求，並招攬了大批立誌從事AI研究的國人科學家。

余凱接棒矽谷NEC Lab主任一職後，又招募來了黃暢。當時，黃暢底下有一個名叫賈揚清的實習生。在NEC Lab期間，賈揚清展露出了高超的數學和工程程式碼能力，曾讓實驗室眾人堅信其日後必有所造詣。

這種薪火相傳的孵化線，在林元慶接手矽谷NEC Lab後仍在繼續。

他引進的實習生謝賽寧，後來與麻省理工教授何愷明共同提出了著名的ResNeXt模型。2022年，謝賽寧還和OpenAI研究員Bill Peebles合著了論文【Scalable diffusion models with transformers】。

以這篇論文為基礎，OpenAI打造出了影片生成模型Sora。

另一間位於普林斯頓的NEC Lab，同樣招攬了楊立昆，以及支持向量機發明者Vladimir Vapnik等泰鬥級人物。

可以說，歷史上沒有任何一家機構，能如NEC Lab這般，擁有此等高手如林的班底。

余凱曾在媒體專訪中如此形容NEC Lab巔峰時期的影響力：如果你在谷歌上搜尋美國NEC Lab，頁面會立刻彈出一句話，你要不要來谷歌工作[7]。

然而鼎盛時期風光無兩的NEC Lab，卻早已埋下了衰敗的草蛇灰線。

五月花號迷航

2002年，楊立昆剛在普林斯頓進行了一年的研究工作，NEC就開始施壓。

管理層毫不客氣地告訴楊立昆，NEC對深度學習沒有一丁點興趣，並順手解雇了當時的實驗室主任。這段經歷讓楊立昆對產業界徹底失望，跑回紐約大學當起了老師。

楊立昆

NEC突然自毀長城，有兩個不容忽視的現實原因：

一是人們對AI失去了信心。彼時，無論是芯片的算力，還是數據的豐富程度，都遠不足以讓深度學習發揮其潛力。與此同時，「第五代電腦」專案的失敗，更是雪上加霜。

「第五代電腦」專案始於上世紀80年代，目標是打造AI驅動的超級電腦。

在日本的設想中，第五代電腦將具備回答問題、知識庫管理、影像辨識、程式碼生成等功能[8]。這個「領先時代40年」的科研專案，一度將美國嚇得不輕，立馬掏出補貼與日本競爭。

如此一拍腦袋的專案，結局可想而知。

1992年，五代機專案正式宣告破產。日本不僅白白浪費了數億美金，還把其他跟風的國家給忽悠瘸了。一怒之下，人們將責任歸咎於AI。日後很長時間裏，AI研究如同過街老鼠，人人喊打。

其次，日本的中央實驗室模式，此時也出了問題。

日本企業對於NEC Lab等中央實驗室的定位，是純粹的基礎科研機構。這種模式沒有與市場和產業接軌，只是盲目追求多拿幾個諾貝爾獎。這讓科學家們非常苦悶，內部時常調侃稱「反正做的東西也用不到產品上」。

因此，當經濟泡沫消失，日本進入失去的時代，毫無實際用處的中央實驗室，理所當然地成了第一批「挨刀」的物件。

2009年-2020年間，NEC多次進行萬人規模裁員，並大幅縮減研發經費。

在此階段，中美科學家們紛紛選擇自主創業，或另擇良木而棲。

2012年，余凱受李彥宏邀請，領導百度的AI業務。在他的號召下，徐偉、黃暢等NEC Lab的同僚，也先後加入百度。後來，他們又跟著余凱一同創辦了地平線。

日本花大力氣點燃的AI火種，最終造就了今天中國AI的沖天火光。2018年NEC第四次大裁員後，其美國實驗室的技術中堅力量，幾乎已流失殆盡。

孤膽英雄

日本AI高歌猛進的步調，隨著NEC美國實驗室的落寞戛然而止。

全球人工智能的歷史仍在繼續，就好像五代機專案從未存在過一樣；而曾經組建了全明星陣容的NEC Lab，也漸漸被淡忘。在失去的三十年裏，日本幾乎沒有在深度學習領域，留下任何一筆痕跡。

不僅如此，深度學習還在日本留下了根深蒂固的偏見。

2016年谷歌的AlphaGo擊敗了李世石，登上了全球科技新聞的頭版。這一年，中國誕生了528家AI企業，催生371起AI投融資。從科學家到VC，都熱情地談論著深度學習的潛力。然而，隔壁的日本，卻是另一番風景。

同年，日本產經省也舉辦了一場全國人工智能大會。有學者準備就深度學習提出兩個企劃案，卻被同席的學術圈研究者提醒，「如果名字裏加上深度學習的話，估計就沒有人來聽了吧」。

這種裹足不前的態度，是日本如今無人可用的重要誘因。

唯一意識到問題的，正是軟銀集團的孫正義。

2017年，孫正義在推出全球最大私募股權科技投資基金（願景基金）時，篤定地表示，該基金只會根據一項策略進行投資，就是AI。

接下來的幾年時間裏，軟銀在AI領域的投資不可謂不激進。

光是在季度和年度報告中，孫正義提到「AI」的頻數就超過500次，並大手筆地為超過400家AI創業公司，註入1400多億美元資金。他甚至還在2020年胸有成竹地表示，史無前例的投資狂潮，將使軟銀成為主導AI革命的投資公司。

然而，孤掌難鳴。更尷尬的是，軟銀還壓錯了寶。

據風投數據庫PItchBook於2023年公開的數據，在26家估值超過10億美元的AI創業公司裏，軟銀只投中了一家。

此外，孫正義雖然斥40億美元投資輝達，卻在其股價暴漲前悉數拋掉，與近10倍的漲幅收益失之交臂。如果不是押中了ARM，孫正義的AI投資或將顆粒無收。

孫正義

在ChatGPT引爆生成式AI熱潮的2023年，孫正義在股東大會上痛心疾首地表示，自2022年末以來他就一直在反省，「為自己犯了很多錯誤感到羞愧」，「哭了好幾天都停不下來」[13]。

失去的時代

孫正義的眼淚，既是對軟銀頻頻押註失誤的悔恨，更是對日本AI產業的恨鐵不成鋼。

2019年時，孫正義曾不加掩飾地公開批判：在當前最重要的科技革命上，日本已變成了一個「後進國」，而使其不斷喪失競爭力的本質原因，是對進步的不貪婪[15]。

這番言論，摻雜了不少情緒因素。實際上，這些都不是日本AI老無所依的根本原因。

深度學習從來都不是一場孤立的革命。

2012年，深度學習能夠爆發，其實有兩個先決條件：一是算力前進演化，當時輝達所開發的GPU，已經初步能支撐起深度學習所需的算力。二是互聯網的全面鋪開，彌補了數據不足的問題。

集成電路、互聯網、雲端運算，隨著這些前置產業陸續成熟，深度學習才得以登上歷史舞台。然而，這些產業，日本幾乎一個都沒有。

當年，在史丹佛教書的吳恩達想要進行大型影像辨識實驗，尚且有谷歌傾盡整個數據中心的算力，來成就他的The Cat Neurons專案（即「谷歌貓」）。

然而福島邦彥和甘利俊一卻沒有這麽幸運。即便是如今的日本，也沒有任何一家民間公司，擁有訓練AI大模型所需的龐大算力。僅有政府主導的理化學研究所中，才能找到「富嶽」這樣的超級電腦。

日本AI的後繼無人，從最開始就埋下了伏筆。

如今，以AI為橫切面的日本科技產業，似乎正在印證孫正義五年前的預言：日本已經失去了過去，但可能正在失去未來。