無人駕駛真的來了，中國人工智能應如何「做大」

2024-07-13科技

7月4日—6日，2024世界人工智能大會暨人工智能全球治理高級別會議在上海舉行。國務院總理李強出席開幕式並致辭。李強強調，要推動人工智能更好服務全球發展、增進人類福祉，並建議要推進網絡、算力、數據等普惠化，為廣大中小企業和普通民眾提供低門檻、低價格的人工智能服務，實作更大程度的數碼包容。

人工智能的核心命題是讓電腦學會完成各類復雜任務的知識。在經歷了符號智能和專用智能等發展階段後，以OpenAI GPT為代表的大模型技術建立了通用的模型架構和學習方法，能夠從大規模數據中持續學習和積累知識，在諸多工上表現出強大乃至超越人類的效能，標誌著人工智能進入通用智能階段。

2022年底，OpenAI釋出ChatGPT後，引發全球關註。近兩年，大模型技術突飛猛進，中國國內上演了「百模大戰」。然而，在追逐更「大」模型的熱潮中，我們也需審視，「越大越好」是否是未來發展的最優解。

數碼社會的關鍵元器件——大規模集成電路的發展，或可為智能社會大模型技術的發展提供一定啟示。如摩爾定律所示，集成電路的成功關鍵在於晶體管密度的迅速提升，而非僅數量的持續增加。透過持續改進制造工藝，電路密度的提升在增強電路效能的同時，也最佳化了能效與成本。對照至大模型技術，模型規模的增長確實帶來了效能提升，但這種提升並非無限制。隨著模型規模增長，所需的計算資源與能耗也在迅速提升，這將成為制約大模型發展的瓶頸。

因此，提升知識密度——即在給定的計算資源內，模型能夠儲存更多知識、具備更強智能——將成為未來大模型技術可持續發展的重要目標，亦是實作大模型普惠發展的重要路徑。在此背景下，面向大模型技術的普惠發展，圍繞極致提升知識密度，未來有三個方向值得重點關註與布局。

一是人工智能科學化。人工智能科學化旨在將人工智能從工程實踐推向科學理論的形成和系統化發展，圍繞「演算法—架構—數據」的技術路線，形成推動大模型知識密度增強的理論基礎。在演算法層面，探索模型效能成長規律，在小模型中高效尋找最優數據和配置，進而外推至大模型。在架構層面，探索腦啟發的模型架構，顯著降低完成任務時參與計算的神經元和計算量，提高模型的推理計算效率。數據層面，探索可延伸、多樣化的高質素數據構造體系，實作自動高效生產、篩選和驗證數據。

二是計算系統智能化。計算系統智能化旨在面向智能技術最佳化和擴充套件現有硬件和軟件架構，如底層芯片、作業系統、數據庫、網絡通訊等，是實作大模型知識密度增強的設施保障。例如，在芯片層面，面向人工智能的專有芯片設計是近年來推動大模型高效運算的重要發展方向。尤其是目前國際上人工智能芯片設計仍處於發展階段，中國在神經網絡處理單元（即NPU）和類腦芯片等人工智能芯片設計方面已形成一定技術與產業優勢，有望在此方向成為技術引領者。基於智能化的軟硬件設施保障，推動算力、網絡、數據等資源的高效利用，實作大模型發展所需基礎設施的普惠化。

三是領域套用廣譜化。領域套用廣譜化旨在推動大模型在各專業領域的套用，實作知識密度增強的套用適配。這意味著，首先大模型需要具備更高的專業素養。在高價值套用場景，例如科學發現、高精尖制造業等領域，大模型具有低成本持續探索的優勢，但前提是要讓大模型具備超越常規的專業能力和決策精度。這需要模型具備對專業領域知識的深度理解。再者，大模型需增強風險管控能力。在高風險套用場景，例如自動駕駛、醫療診斷，大模型需要具備極高的情境敏感性、適應力以及決策可靠性，從而在盡可能規避風險的前提下，進行高效決策。透過增強大模型在各專業領域的適配能力，推動大模型套用的專業性、穩定性、安全性。

通用人工智能的發展目前尚處於初步發展階段，距離人工智能技術的普惠套用仍需長期持續探索與投入。中國作為世界大國，理應在人工智能的發展中做引領者、擔當者和示範者，協同世界各國，共同走向更加美好的智能未來。

（作者系清華大學電腦系長聘副教授）

發於2024.7.15總第1148期【中國新聞周刊】雜誌

雜誌標題：大模型普惠發展需提升知識密度

記者：劉知遠