系統籌劃破解大模型發展瓶頸

2024-05-08科技

當前，人工智慧技術的創新叠代為數位經濟發展帶來更加強大的驅動引擎，相關產業已經成為國家現代化治理的重點領域。如何推動人工智慧大模型不斷與各領域交叉融合，逐步成為產業創新的關鍵抓手和驅動新質生產力的關鍵引擎，值得探討。

眾所周知，ChatGPT、Sora等生成式人工智慧產品重新整理了人們對人工智慧技術創新的認知水平。近乎人類的表達方式、真假難辨的文生視訊等功能顛覆了過去人們對於人工智慧尚處於探索初期的觀念。這些產品反映了當下人工智慧產業的一個基本趨勢，即以大模型為基礎，實作人工智慧技術的產業化落地套用。

通俗一點說，大模型是指體量龐大、執行技術參數眾多、具備強大計算能力的機器學習模型，使得人工智慧產品能夠獲得類似人類思考的能力。大模型之所以能夠成為人工智慧產業發展的主要技術趨勢，是因為能夠帶來更強大的智慧化水平。在過去，人工智慧客服雖以「人工智慧」冠名，但能完成的工作任務不過是根據使用者輸入的關鍵詞觸發相應的對話機制。時至今日，以大模型為基礎的人工智慧產品能夠對使用者輸入指令分析和辨識，進而提供針對性、個人化的回復內容。

人工智慧產業也面臨著相同的技術創新困境。比如，基於大模型的人工智慧產品需要海量的訓練數據用以支撐演算法模型的持續叠代和最佳化。這種訓練數據的需求量不僅表現為千億級別的數據資源，還表現為訓練數據應當囊括各個行業、各個領域，且數據所反映的資訊內容本身具有完整性、準確性等特征。但是，這種訓練數據需求的滿足並不能簡單透過抓取網路公開數據，它可能涉及對個人資訊權益或者其他企業數據財產權益造成侵害。

又如，海量的訓練數據需求意味著需要電腦具備高效準確處理這些數據的計算能力。這種計算能力與芯片等硬體裝置密切相關，人工智慧產業所需要的算力芯片不是指個人電腦中的CPU芯片，而是更適合該產業的GPU芯片。然而，算力資源的擴張和發展並不是僅僅透過頻繁建設算力基礎設施即可實作，因為同頻率計算會對電力資源造成巨大消耗，進而導致現階段可用算力資源較為緊張。

為解決這些發展瓶頸，有關部門先後頒布了多項地方性人工智慧產業發展保障政策檔。不過，當前更需要在國家層面明確更為體系化、系統性的產業發展指引，促使人工智慧大模型更好地服務千行百業。

在訓練數據供給方面，應當探索適用於人工智慧領域的公共數據訓練平台，加快探索和真正落地公共數據開放利用機制。將人工智慧產業訓練數據需求的解決與數據要素市場化配置基礎制度建設協同進行，在理清理順數據權益歸屬的基礎上，進一步釋放數據要素對人工智慧技術創新的加持效果。

在算力資源供給方面，可在全國範圍內統籌規劃和整體布局關鍵算力基礎設施的選址和建設，避免出現無序建設算力基礎設施導致全國算力資源發展不平衡。同時，算力互聯互通也是現階段解決算力資源緊張的重要政策工具，透過整合公共算力、私人算力並進行統一排程，提供能夠同時滿足一般算力、智算算力和超算算力等差異化的產業需求。

在演算法模型創新方面，應當重點推動基礎演算法模型的自主研發。引導和支持相關科研人員深入開展大模型技術的實質創新。探索產學研協同創新研發機制，充分保護人工智慧演算法研發成果相關的智慧財產權。有規劃性地布局人工智慧演算法研究的後備人才儲備，引導和鼓勵科研人員深入開展演算法相關的基礎技術研究。（本文來源：經濟日報作者：趙精武）