從玩具、工具到「同事」再到「AI愛因史坦」，我們離通用人工智慧有多遠？

2024-07-16科技

如今，通用人工智慧（AGI）已成科學界和產業界聚焦的關鍵詞之一，僅僅是幾年前，還有不少人認為至少要10到50年才能實作AGI，甚至有人認為，永遠不可能實作。時至今日，後者已是少之又少。但相對於大眾對於這一波技術變化的興奮，不少AI（人工智慧）領域的一線學者和產業領袖恰恰覺得，當下的AI要發展到AGI還有不少路要走。

在復旦大學浩清特聘教授、上海科學智慧研究院（以下簡稱「上智院」）院長、可信大模型公司「無限光年」創始人漆遠看來，「通用人工智慧的最高體現之一是發現復雜世界的未知規律，簡言之就是應該是一位‘AI愛因史坦’，這需要我們打造結合快思考的‘黑盒’機率預測和慢思考的‘白盒’邏輯推理，打造‘灰盒’可信大模型；並且透過科技和產業的深度融合，推進基礎研究、人才培養、成果落地，打造科學智慧創新生態。」

就在不久前落幕的2024世界人工智慧大會（WAIC）暨人工智慧全球治理高級別會議，上智院成功舉辦了「人工智慧：科研範式變革與產業發展」主題論壇，這也是這家新型研發機構首次亮相WAIC。上智院可以說是上海在探索創新驅動的「1+1+N」科學智慧生態模式方面的典範，即由上智院這個「1」作為生態系的中心和樞紐，負責整體戰略規劃、資源整合和關鍵技術的研發與創新，聯合另一個「1」復旦大學，攜手多家高校、科研機構、科技企業、創新團隊和投資機構這些「N」，共同推動科學研究、人才培養、科技成果轉化以及產業的創新、升級。

AGI的標準應該是打造「AI愛因史坦」

從技術視角而言，越來越多參數的大模型，會走向通用人工智慧嗎？時至今日，無論是從AI技術本身的角度還是從能耗的角度而言，基於Transformer自回歸架構的大模型雖然還有紅利，但並不足以通往通用人工智慧。人工智慧需要發展新的「灰盒」可信大模型。這是漆遠在學界、產業界多年實戰的經驗總結。

十年前，懷揣著「讓人工智慧有用」的想法，漆遠帶領團隊把阿裏巴巴的核心機器學習系統第一次從200萬參數提升百倍到幾億參數，取得了大規模的業務效果提升，彰顯出數據、演算法和工程能力的整合變革。這正是今天人工智慧圈津津樂道的Scaling law的體現。

漆遠回憶，團隊當時的確嘗到了Scaling Law的甜頭：模型參數百倍的增加之後，整體效果得到了突飛猛進的提升。「但是現在我卻想：我們當年做AI模型為什麽沒有做到更大的程度？為什麽當年再往前走一步的時候，我卻停在了這裏？」他說，「大模型上億參數還是不夠，要走向百億、千億，甚至是萬億。當時不論是學術界還是機構缺的都是算力，而且即使在工業界，要達到如此高的算力，也需要非常高的成本，更不用說學界。」

之所以說AGI的標準應該是打造「AI愛因史坦」，漆遠解釋稱，就是要有效而聰明。首先，愛因史坦當年透過幾個關鍵的數據點，看到了「20世紀初物理學的烏雲」，AGI也應該能發現理解復雜世界的未知規律。但目前的大模型無一能夠做到，雖說視覺大模型SORA對物理世界的模擬達到了前所未有的程度，然而SORA依舊是基於對二維世界的模擬來構建三維世界，離透徹理解物理世界還有很大距離。其次是功耗，人腦的功率大概是15瓦，而一張GPU的峰值功率就是幾百瓦，更不用說支持訓練通用大模型需要千卡或者萬卡集群。就當下而言，如果持續沿用現有的架構，將需要天量的功耗，很難達成有效且聰明這個目標。

「AI愛因史坦」也是AI for Science（註：科學智慧，下文簡稱AI4S）的關鍵目標。科學智慧在加速求解已知的物理方程式中已經發揮重要作用，但是科學智慧更需要結合已知規則與數據，減少對數據和算力的嚴重依賴，提升推理預測的精準性，並根據數據來調整知識規則，提出嶄新的科學理論。這也與漆遠在復旦大學和上智院工作的長遠目標——「用人工智慧來理解復雜世界，發現不知道的規律」不謀而合。

「灰盒」可信垂直領域大模型賦能千行百業

大模型從AI工具落地新質生產力，亟需解決哪些問題？在漆遠來看，大模型行業面臨諸多共性挑戰，使得技術、產品與市場需求難以匹配。

「目前大模型落地，我覺得最大的問題就是：猛一看好像有用，真的一用又不行。」漆遠解釋稱，今天大語言模型的核心簡單來說就是預測下一個詞，根據過去多個詞來預測下一個詞，但是這並不適用於多步驟的嚴謹推理。「語言是交流的工具，而不是思維的工具。」近期，麻省理工學院（MIT）等機構發表在頂級學術期刊【自然】雜誌的文章指出，語言是傳播文化知識的有力工具，它可能與我們的思考和推理能力共同前進演化，能夠反映人類認知的復雜性。但是語言並不產生推理的復雜性。

針對大模型現有的不靠譜、解釋性不高、成本高等特點，一個真正有效的解決方法是把機率的神經網路推理與邏輯的符號計算結合起來，類似於諾獎經濟學得主丹尼爾·卡尼曼所著的【思考快與慢】一書所說的人類基於本能的快思考和基於邏輯推理的慢思考的結合，「可以說是一種‘灰盒’大模型。」漆遠認為，將符號計算與神經網路相結合的「灰盒」可信大模型，可降低人工智慧的「幻覺」，解決垂直領域專業問題，從而賦能千行百業，釋放大模型的生產力。

什麽是「灰盒」可信大模型？「原來認為深度學習是‘黑盒’，現在我們把邏輯推理的‘白盒’與深度學習結合起來，就變成‘灰盒’了。」漆遠解釋說，「原先的‘黑盒’使人們對數據產生結果的過程一無所知，而‘灰盒’大模型借助邏輯推理可以令人‘知其然，更知其所以然’。同時，從另外一個角度來看，‘灰盒’大模型可以用深度學習來減少不符合現實世界觀測數據的規則。」

漆遠表示，要讓各行業的復雜場景成為AI發揮核心作用的新戰場，無論是在金融保險、風電能源，還是遠洋運輸、醫療制藥的場景，需要將系統的行業知識、推理邏輯和決策機制與大模型結合。「灰盒」大模型既是通用人工智慧的大方向，更是大模型在垂直領域裏深度滲透、真正解決實際問題的利器。「如果從工業界角度來看，這個理解非常直觀。」漆遠舉例，醫生不需要成為律師，律師也不需要成為投資專家，每個專業角色都應該專註自己的領域，做好自己的生產力工具。從技術層面來說，如果讓一個大模型過度學習不相關的任務，就可能會發生「災難性遺忘」。就像李白如果整天做會計而不寫詩，他的詩歌靈感可能也會逐漸消退。「我們已經觀察到，在訓練垂直領域的大模型時，如果讓模型學習過多不相關的功能，會對其原有的能力產生幹擾。因此，做好垂直領域的‘灰盒’大模型，我認為在產業落地中具有極大的價值。」

「我認為，‘灰盒’大模型會在通往AGI和垂直領域產業落地的路上發揮越來越重要的作用，因為從貝葉斯的方法論上來說，就是把我們已知的知識，和隱藏在數據中的未知資訊結合在一起，來發掘新的規律，解決科學與產業問題。」漆遠直言，未來，「AI愛因史坦」也可以是「AI巴菲特」。

打通創新鏈，構建科學智慧創新生態

就在此次2024世界人工智慧大會上，漆遠領銜的團隊釋出了百億參數的可信光語金融和醫療大模型。這兩個垂直領域大模型的測試都超越OPEN AI的萬億參數大模型GPT4-Turbo，再次引發業界對大模型落地的關註。

「今天的人工智慧突破不僅來自底層原理的創新，更有面向社會需求的產品驅動。社會需要的不僅是理論文章的發表或者商業模式的創新，而是科技創新與產業創新深度融合，是基於第一性原理的突破。這兩者一旦結合，我們就可以遊到海水更藍的地方。」漆遠說。

學界和業界有著不同的使命，學界要探索新事物，工業界首先要解決實際問題。目前國內外普遍存在的一個共性問題：研究機構需要研究很多技術創新問題，但如果忽略產品化和社會需求，會有兩個短板：缺乏真正的競爭壓力，無法在競爭中錘煉創新技術；沒有有效的市場資訊反饋來牽引技術研發的方向。

為此，漆遠一直期待打通「大學—研究院—初創企業」的創新鏈條，營造一個好的創新生態，不僅思考底層技術，也要抓緊市場需求。以市場需求和場景牽引產品方向，從底層創新打造產品核心競爭力。

2023年成立的上智院，正致力於知識與數據結合的AI for Science原始創新。近期，上智院釋出了面向新能源、保險、城市管理等產業套用的伏羲系列氣象大模型2.0，並牽頭發起了智慧氣象創新生態聯盟，聯合多家單位逐步推進伏羲系列氣象大模型2.0的產業化套用。「灰盒」可信大模型的產品落地也在行程之中，漆遠擔任創始人的可信大模型公司——無限光年已成立。

為進一步繁榮科學智慧創新生態，由上智院與復旦大學聯合主辦，上海市科學技術委員會、上海市發展和改革委員會、上海市經濟和資訊化委員會、上海市教育委員會等多部門聯合指導的第二屆世界科學智慧大賽已啟動。大賽設定百萬獎金面向全球招募選手，共同探索科學智慧前沿領域。同時，上智院主導開發了一套涵蓋多模態科學數據的科學數據平台，該平台具備從數據采集、加工到管理和建模的全鏈路能力，保證數據的高效加工、可信和安全互通。基於這一平台，上智院與合作夥伴構建了面向生命科學、物質科學和大氣科學等領域的多個高品質科學數據集，為科學智慧研究提供了寶貴的資源。此外，上智院牽頭發起了全球科學數據生態聯盟，首批聯盟成員單位包括中國電信股份有限公司、中遠海運財產保險自保有限公司、上海臨港新片區跨境數據科技有限公司等十余家單位。聯盟將透過政府、企業、高校、研究機構等多方合作，構建全球性、多領域的科研大數據資源開放與共享平台。

「不論科研還是產業，都不應‘為了新而新’，期待我們能構建未來的通用人工智慧和套用，解決真實世界的問題。」漆遠說。

作者：

圖：上海智慧研究院供圖編輯：吳金嬌責任編輯：姜澎

轉載此文請註明出處。