九卦｜AI與大模型如何真正改變人類生活？ - 科技

2024-09-04科技

作者 | 百融雲創研究院

來源 | 九卦金融圈

在當今這個日新月異的科技時代，人工智能（AI）及其核心——大模型技術，正以前所未有的速度推動著全球經濟的轉型升級和社會生活的深刻變革。作為AI技術領域的佼佼者，百融雲創憑借其在大語言模型、自然語言處理（NLP）、深度機器學習、私密計算和雲端運算等領域的深厚積累，正積極擁抱並試圖引領這場科技革命的新浪潮。

本文整理自百融雲創創始人、董事長張韶峰9月1日在「金融行業大模型套用的新進展和新趨勢」閉門研討會中的發言內容，深入探討AI及大模型如何成為全球生產力提升的最強引擎以及中國AI發展的特色之路。

AI及大模型的劃時代發展

什麽是AI，為什麽AI這麽強大？因為可以模擬人腦慢思維的兩種能力：歸納和演繹。歸納是一種從個別到一般的推理方法，即從特定的事實或觀察中推匯出一般性的結論或原則。演繹則是一種從一般到個別的推理方法，即從已知的一般性原理或前提出發，推匯出關於個別情況的結論。

自AI技術誕生以來，大模型作為其核心組成部份之一，一直備受關註。大模型以其強大的數據處理能力和廣泛的套用場景，正在逐步改變著我們的生活方式和工作方式。從最初的簡單演算法模型到如今的大規模預訓練模型（Foundation Model），大模型的發展經歷了從無到有、從小到大的跨越式進步。

2017年，Google Brain團隊提出的Transformer架構為大模型的發展奠定了堅實基礎。這一架構透過引入註意力機制，使得模型能夠高效關註輸入序列中的關鍵部份，從而提高了處理效率和準確性。隨後幾年裏，隨著技術的不斷叠代和升級，大模型的效能和套用範圍也得到了顯著提升和拓展。

大模型之所以能夠在全球範圍內迅速崛起並受到廣泛關註，主要得益於其強大的泛化能力和相對較低的成本。在預訓練階段，大模型能夠在更大、更多樣性的數據集上以無監督的方式學習更抽象、更深層次的知識；而在微調階段則能夠針對具體任務進行最佳化調整，實作高效套用。這種「一次訓練、多次使用」的特點使得大模型在不同領域和場景中都能夠發揮出巨大的價值。

百融與全球大模型前沿趨勢始終一致。

大模型將是全球生產力提升的最強引擎

據麥肯錫報告指出：大模型有望為全球經濟貢獻約7萬億美元的價值；而中國則有望貢獻其中約2萬億美元。這一數碼充分展示了大模型在全球經濟中的重要地位和發展潛力。

高盛的調查顯示，羅素3000指數公司中有16%的公司在2023年的財報會議中提到了大模型，其經濟學家估計，大模型將在十年內提高1%的整體勞動生產率，並為標普500指數帶來約14%的增長。

美國的大模型商業化套用進展迅速，已經覆蓋了醫療、金融、房地產、媒體等多個領域。大模型在金融行業的價值場景主要為行銷與銷售、投顧與投研、客服與營運、風控與合規。

2023年3月30日，彭博社釋出專門用於金融領域大語言模型的LLM（500億參數）BloombergGPT，透過給定的主題和語境，自動生成高質素的金融報告、財務分析報告及招股書，同時輔助會計和審計方面的工作、提煉梳理財經新聞或者財務資訊。

史丹福大學釋出的【2023年人工智能索引報告】中顯示，2022年，美國的35個大模型中，只有3個大模型來自於實驗室，32個都誕生於產業中。

中國的大模型商業化套用正在逐步展開，但整體上仍處於起步階段。

截至今年4月，海內外前十套用存取量相差約46倍，國內尚未出現超級套用。海外前十的AI產品存取量共計55.02億，國內僅1.2億，海外排名第一的GPT存取量為18.6億，Kimi為2004萬，相差93倍。

AI的6000億美元問題：

2003年9月紅杉資本分析師大衛·卡恩（David Cahn）發表了一篇題為【AI的2000億美元問題】，提出AI基礎設施建設的預期收入與AI生態系的實際收入增長之間存在巨大差距。目前這個2000億美元的問題，已經翻成了6000億美元，這裏面蘊含的問題是如何從終端獲得價值，再深入思考，既然AI這麽厲害，為什麽AI還沒有從本質上改變人類的生活？

張韶峰總指出，人工智能是一項本質的根本性的技術，深度嵌入場景，並輔以組織的創新、監管的創新、商業模式的創新才能真正的發揮其威力。

大模型發展的幾個趨勢和判斷

1、AI Agent讓大模型從有趣到有用:大模型是大腦，AI Agent除了大腦，還有手有腳，像人一樣能思考能執行（Function Call）

Agent（代理）這一概念最初根植於哲學領域，它描繪了一種具備欲望、信念、意圖並能夠自主行動的實體。AI Agent與大型語言模型（LLM）之間的關系可以類比為一個復雜生物系統與其高度發達的大腦。AI Agent像人一樣思考與行動：獨立思考、自主執行、持續叠代，智能體能夠實作多個大模型的協同工作，補充知識、呼叫搜尋，增強大模型的能力，深度嵌入若幹行業的若幹業務場景並解決問題。AI Agent的架構設計遵循嚴謹的邏輯與專業的原則，確保各元件間的高效協同。

百融憑借其在大模型領域的深厚積累，透過自主搭建的大模型底層框架，實作了對百億級參數的高效訓練，自主大模型的跨越式發展為AI Agent的底層架構帶來了突破性的技術方案。

百融的Agent builder賽博坦通過整合生成式大模型、RAG策略及外掛程式化架構，構建了一個高效、智能、可客製的多場景、多語言互動解決方案，為企業提供了強大的自動化客戶服務與知識管理能力，更重要的是能夠直接促進業務交易，2023年百融AI Agent促進了550億金融資產交易，2024年預計800億。

百融VoiceGPT是AI Agent深度場景化的領先實踐，VoiceGPT高度成熟，目前已經叠代出情感辨識和情感語音輸出功能、語意理解準確率提升至97%，適合於多行業多場景的套用，包括金融行業及非金融行業的行銷、客服、通知、回訪等場景。

百融Agent builder賽博坦整體技術框架

2、場景、場景、場景，深入場景的套用才能讓大模型實作從通識向專業的前進演化，數據飛輪驅動業務增長飛輪

大模型能力決定下限、場景適配度決定上限。只有深度嵌入場景形成數據飛輪，才能反哺提升模型能力和效果。

一個大模型能夠解決所有問題嗎？Scaling Law是OpenA於2020年提出的理論：認為模型越做越大，就可能實作通用人工智能。

但在實踐中，通識大模型其實難以滿足具體場景問題，這裏需要的是垂直大模型，目前業內公認通識大模型能夠具備本科生的水平，那麽專業垂直大模型則應該具有博士的水平。

而且完成一個具體任務往往需要不同垂直大模型的組合，每一個大模型負責解決一個業務單元的問題，多個垂直大模型精密整合解決特定場景的問題。

案例：如何利用AI Agent批次復制1萬個優秀的理財經理？

行業痛點：因為資源的稀缺性，普通居民難以享受財富管理專業服務

百融利用RAG技術訓練財富垂直大模型

3、多模態大模型技術持續演進，混合多模態有望催生現象級套用

多模態大模型的輸入及輸出都是文本、影像、語音、影片的任意組合。多模態是基於大模型的智能體不但能思考，還能夠執行的關鍵技術。混合多模態即時互動變革人機互動方式，有望催生強互動性場景套用。

百融的數碼人叫做AvatarGPT ，可套用於機場、商城等人流密集、需要智能引導的場景。依托百融自研的大語言模型，AvatarGPT實作了高達95%的語意辨識準確率，首字輸出速度最快可達200毫秒。結合非結構化數據處理專利與函數呼叫技術，知識抽取、理解及執行均達到前所未有的精準度。

在全球AI大模型競爭中，中美兩國占據主導地位，目前全球釋出的大模型數量，中美合計占約80%；只有中美兩國具有：大量資金、豐富人才、強大教育系統、強烈獲勝意願。

美國在AI領域的投入與領先，將投入3000億美元，其芯片技術領先中國約10年，並可能與加拿大等國家合作獲取能源與人才，目前美國高度關註中國AI發展，輝達軟件CUDA只能在輝達的GPU上執行，不能相容其他硬件。

但中國仍然憑借超大市場規模、豐富套用場景的優勢走出一條特色化之路：卷AI的原生套用、形成套用與技術的飛輪：

卷行業大模型解決方案、滿足場景的需求，在終端實作價值，獲得利潤，持續從市場套用中獲得利潤，反哺技術及人才，透過套用領域的研發倒逼並推動基礎模型的趕超，最終實作底層技術的突破。