獨家對話生成式AI之父：中國將在幾年內縮小差距

2024-09-04科技

生成式人工智能正在全球範圍內掀起一場劃時代的ICT產業革命。算力、演算法、數據已成為未來綜合國力比拼的必爭之地。心智觀察所日前連線業界享有盛名的「生成式AI之父」尤爾根·施密德胡芭（Jürgen Schmidhuber）。就AIGC發展的內在理路，AGI的可能性以及中國AI產業發展等一系列問題進行了深入對話。

目前尤爾根·施密德胡芭先生擔任瑞士人工智能實驗室IDSIA的科學主任以及沙特阿拉伯阿蔔杜拉國王科技大學（KAUST）的人工智能計劃負責人

【紐約時報】曾以「當AI成熟時，它或許會稱尤爾根·施密德胡芭為‘父親’」為標題對尤爾根·施密德胡芭進行過報道。在1990-91年間，他為「生成式AI」奠定了基礎，介紹了生成對抗網絡（用於深度偽造）的原理、非規範化線性Transformer（ChatGPT中的「T」），以及自監督預訓練原理（ChatGPT中的「P」）。

他的實驗室還開發了LSTM（長短期記憶），這是20世紀參照最多的人工智能技術，以及高速神經網絡（Highway Neural Networks），這是第一個非常深的前饋網絡（其變體後來成為21世紀參照最多的人工智能技術）。埃隆·馬斯克曾發推文稱：「尤爾根·施密德胡芭發明了所有東西。」尤爾根·施密德胡芭倡導和引領的AI技術已被套用於超過30億部智能電話上，每天被使用數十億次。

心智觀察所：很高興有這樣一個對話的機會。您發表過對長短期記憶（LSTM）的架構和訓練演算法，是否可以把LSTM人工神經網絡與人腦等生物神經網絡進行一個類比？

尤爾根·施密德胡芭：事實上，LSTM受到了人腦的啟發，人腦有大約1000億個神經元，每個神經元平均與10000個其他神經元相連。一些是輸入神經元，為其余神經元提供數據（聲音、視覺、觸覺、疼痛、饑餓）。其他則是輸出神經元，用於肌肉控制和移動。大多數神經元隱藏在輸入和輸出之間，我的思考的出發點就在這裏。所有神經元都透過改變連線強度來學習，這決定了神經元相互影響的強度，並且似乎對你一生的所有經驗都進行了編碼。我們的人工神經網絡（比如LSTM）也是如此，它比以前的方法學得更好，可以辨識語音、筆跡或影片，最大限度地減少痛苦，最大限度地提高快樂，還能駕駛模擬汽車等。

心智觀察所：您提到的LSTM可以「最大限度地減少痛苦，最大限度地提高快樂」，這意味著什麽？而這對於實作通用人工智能（AGI）有多重要？

尤爾根·施密德胡芭：這是至關重要的！不過，我應該先解釋一下如何對一個學習型的通用人工智能（AGI）進行編程。你其實不需要告訴它具體該做什麽事情。相反，你只需要給它一個評價函數（evaluation function），讓它去最大化這個函數。

例如，給一個機器人裝上疼痛傳感器，當它撞到障礙物或感到「饑餓」（由於電池電量過低）時，這個疼痛傳感器就會產生負數。而機器人的最終目標是盡可能減少這些負數的總和，因此它必須透過反復試驗來找到避免痛苦的方法。直到某一時刻，它就學會在感到饑餓時快速找到充電站，同時避免撞到障礙物。

美劇【西部世界】被編程的「人類」

動物和人類的學習方式本質上也是類似的，都以最大化獎勵並避免痛苦來進行學習。而他們的評價函數當然是由生物前進演化發明或被「編程」的。那些給他們帶來前進演化優勢的評價函數得以保留下來。而人工智能的前進演化至少在仿真模擬中已經存在了幾十年了，也已相同的方式正在進行著。

心智觀察所：您提到機器人「可能因為電池電量低而感到饑餓。」這讓我想到，特斯拉有一個野心勃勃的人形機器人專案，該專案面臨的一個瓶頸就是如何最佳化能耗，比如跳躍和爬樓梯比在地板上行走需要消耗更多能量。您怎麽看待這個問題？功耗問題會成為人形機器人的阿基里斯之踵嗎？相應的解決辦法是什麽？

尤爾根·施密德胡芭：未來不會只有一種類別的人形機器人，而是會有成千上萬種不同類別的機器人，有些很小，這樣它們就可以從內部檢查和修理小型機器，還有一些則不僅外形高大，力量甚至比現在的一些工業機器人還要強。

有些機器人將會透過連線外部電池的電纜來解決能源問題，另一些則會使用汽油發動機，還有一些在深空中的機器人將使用基於放射性衰變的長效核電池，這類電池在上個世紀的無人航天器中已經使用過了。靠近太陽的，比如在水星上的機器人將大量利用豐富的太陽能。某個時刻，人工智能自己將會發明新的、更高效的電池。事實上，今天的AI已經被用來研發新的有用化學物質、材料、催化劑、藥物等。

特斯拉工廠內的機器人

心智觀察所：有關AI和藥物研發問題，目前您在KAUST AI中心也在從事這方面的工作。甚至像輝達和新思科技這樣的半導體公司也在使用AI幫助生物制藥公司進行藥物研發。芯片設計和藥物設計之間是否有相似之處？

尤爾根·施密德胡芭：所有人工智能的執行都需要高效的微芯片。然而，芯片設計和藥物設計是由不同類別的AI驅動的。藥物設計的AI更像是材料科學或化學的AI。這又是如何運作的呢？我們的深度人工神經網絡會觀察某些特定化學物質在特定溫度、壓力、催化劑和其他條件下如何相互反應。透過大量的訓練樣本，它們學會預測最終輸出物質的性質，學會直觀地理解化學反應的過程。

現在我們可以在逆向模式下使用這些預測機制：假設我們想創造一種以前從未觀察到的特定理想特性的新材料，我們需要如何改變輸入條件（比如催化劑、材料等）才能獲得這種材料？AI化學家會對此提出合理的建議。如果它在現實世界中真的有效的話，那就一切順利。不然，我們將會用新的訓練範例來進一步改進神經網絡。

這種方法可以套用到很多地方，例如使用更好的材料可以直接從稀薄的空氣中捕獲碳，從而減少全球暖化；或者透過更高效的膜技術從海水中提取淡水；可以快速進行藥物設計以改善醫療健康。我們的KAUST AI中心正在研究這些課題。

心智觀察所：在人工智能機器學習支持的創新藥物發現方面，應該如何應對社會倫理的挑戰？

尤爾根·施密德胡芭：人工智能科學家提供解決方案，而往往將其倫理規範留給其他人。事實上，有些關於AI監管法規的炒作是愚蠢的。我們無法規範基礎人工智能研究，就像我們無法規範數學一樣。而在另一方面，我們可以規範人工智能在金融、汽車、醫療保健等領域的套用。不過，這些領域也已經搭建了不斷適應各種新情況的監管框架。讓我們確保法規不會扼殺開源運動！這就是為什麽我簽署 LAION 公開信的原因（相關資料可見於https://laion.ai/blog/transparent-ai/）。

心智觀察所：我們查閱了您簽署的LAION的公開信，對「開源是AI安全的黃金標準」和「開源是創新的催化劑」這兩個聲明印象深刻。但有點驚訝Yann André LeCun也簽署了這封信，您之前接受某中國媒體采訪時，曾批評他抄襲了您的相關AI學術理念。不過，可能存在一個問題，開源很容易被知識產權破壞者操縱和利用。您認為開源在知識產權保護方面是否有一些弱點？

尤爾根·施密德胡芭：與公域軟件不同，開源軟件可能附帶某些特許條件和限制。我沒有看到關於知識產權方面的問題：如果你不想分享你的軟件，那就不要讓它變成公用的。但如果你選擇共享，它可能會變得更受歡迎，而這也可能會帶來許多來自下遊方的益處，包括商業上利益。

心智觀察所：KAUST人工智能中心位於沙特阿拉伯。目前，也有不少中東國家在人工智能方面的創新步伐非常快。您如何評價中東在人工智能創新方面的雄心？此外，據報道，美國因為擔心中東成為中國人工智能研發的「後門」從而放緩了對中東的人工智能芯片出口。你的工作有沒有受到某些地緣政治因素的影響？

尤爾根·施密德胡芭：沙特公共投資基金（PIF）計劃投資400億美元用於AI。阿聯酋也有類似的雄心。中東當地的人口年輕並且樂觀地認為AI將可以改善他們的生活。當然，科學和技術不可能完全免受地緣政治的影響，有時甚至受其驅動。

有一個著名的例子：80年前——1944年，二戰期間，德國佩內明德（Peenemünde,註：二戰期間，它是納粹德國V1和V2火箭的研發基地）迎來了太空時代，當時沃納·馮·布勞恩的團隊將第一個人造物體送入太空。25年後，1969年，冷戰期間，同一支團隊（現在在美國工作）將人類送上了月球。當時一切都圍繞著火箭科學展開，今天，一切都圍繞著人工智能展開。

佩內明德科技博物館內的航天器展覽

無可置疑的是，我們也意識到主要大國之間地緣政治的緊張局勢，但我一直在強調，我們在KAUST由沙特資助的開源人工智能研究是惠及全人類的，而不僅僅是某些特定的公司或國家。

心智觀察所：中國的生成式AI產業仍處於早期發展階段，但成長迅速，並且中國推出了越來越多的大語言模型。您認為中國應該怎麽做才能縮小與美國在AI加速器（用於訓練和AI推理的GPU）方面的差距？

尤爾根·施密德胡芭：我認為中國已經在大力投資建設自己的自主可控的AI硬件，試圖模仿目前只有荷蘭的ASML能夠做到的事情，因為美國政府在阻止ASML向中國交付其最新的芯片制造所需要的光刻機。

總體而言，歷史證明，一個主要大國在技術上追趕另一個大國可能只需要幾年時間。例如，德國在1938年發現了核分裂（原子彈的原理），僅僅7年後，美國就擁有了可用的核武器。而再過4年，蘇聯也有了核武器。到如今，許多國家都擁有核武器。值得註意的是，中國目前在人工智能領域發表的論文和獲得的專利數量超過了其他任何國家。如果中國在未來幾年內沒有縮小硬件差距，我會對此感到十分驚訝。