沈艷：人工智能在數碼金融中的套用

2024-08-28科技

題記： 2024年7月3日，2024中國數碼經濟發展和治理學術年會在清華大學成功舉辦。北京大學國家發展研究院教授、北大數碼金融中心副主任沈艷以【人工智能在數碼金融中的套用】為題進行了主旨演講。本文根據沈艷教授現場發言內容整理。

很榮幸受邀，謝謝葉老師剛剛的介紹。我今天的主題是「人工智能在數碼金融中的套用」，並拋磚引玉，提供一些思考。我們的大背景是，2023年10月總書記提出來的五篇大文章當中，特別提到要做好數碼金融大文章。

先介紹一下什麽是數碼金融。它是過去十多年當中金融體系裏面最重要的創新，主要是利用數碼技術為我們在支付、貸款、保險、投資等方面的新金融工具、金融模式，也包括金融基礎設施建設。

我認為可以從三個維度去理解數碼金融的發展變化：

第一個維度刻畫金融部門，包括貨幣以及支付、信貸、保險、資產管理以及外匯等相關機構與業務活動。

第二個維度是數碼技術，涉及到AI、區塊鏈、雲端運算等等。今天討論的AI，很多時候是把很多數碼技術包含在內探討，比如在運用人工智能時，也離不開大數據、區塊鏈、雲端運算、算力等的討論。

第三個維度是商業模式，比如B2C、B2B、P2P、B2G，以及平台本身多邊的模式。

當我們講創新的時候指的是什麽呢？可能主要是在今天我們考慮人工智能的時候，涉及的是場景、數據、演算法、算力，他們在改善金融服務方面的作用。金融服務包括四個維度：改善金融的觸達、提高金融的效率、能不能提升我們的風控，以及金融安全的問題。其中，金融安全的問題既包含程式套用的安全，也包括是否觸發金融風險。

我主要從四個領域來簡介人工智能在數碼金融當中的套用。

首先是智能客服。銀行常常要面對使用者大量的業務咨詢，因此往往需要龐大的客服群體。但是，客戶咨詢在時間上的分布並不均勻，可能很多時候沒有人打電話，人員過多構成浪費；但是人員過少又會在高峰期無法快速回應客戶的需求，造成客戶體驗差的現象。另外，年輕人離職率也很高，銀行也面臨好不容易培訓上手的客服用不了多久就流失的現象。某金融集團的智能服務在一年中共有超過10億次客服的回答量，他們的智能語音服務可以覆蓋其中的86%，解決率達到92.3%。這就極大提升了服務效率。然後，客戶與智能客服的對話形成新的文本，進一步分析這些文本可以開展智能服銷業務，進一步向潛在客戶推薦相應的金融產品。2021年實作了1000多億近2000億的智能服銷的成果。

第二個領域，數碼信貸。長久以來，小微企業和個人面臨「貸款貴、貸款難」問題，金融存在不夠普惠的現象。相較於大企業，中小微企業和銀行等金融機構之間的資訊不對稱更不易於解決。事前防範「逆選擇」風險和事後防範「道德風險」，均需要金融機構能以較低成本來做好上述風控。人工智能能夠幫助我們在數碼信貸方面有所作為。一方面，利用平台可以獲取大數據，降低客戶獲取的難度；基於大數據可以和恰當的機器學習模型相結合的新的風控模型，可以提升事前風控能力、降低逆選擇風險。另一方面，平台可以用較低成本獲取客戶再貸款之後的一些行為和交易資訊，這也有助於做好貸款管理，防範道德風險。微眾、網商這樣的互聯網銀行，以非常少的人員來服務非常多的客戶，這是人工智能用在模型的預測以及還款能力的預測等方面的套用，這也是相對比較成熟的技術套用。

第三個領域，量化投資。量化當中的套用，首先是投資資訊的搜集。其次，會透過人工智能的模型對交易習慣做一些學習。再次，做大模型的一些預測，看看能不能夠提升數據，做到因子的提取，做到降維。全球用AIML（人工智能標示語言）、人工智能或者是機器學習這一類對沖基金的占比，從2010年到2018年一直是增加的，但是2019年以後就開始下降。收益率做了一個比對，2019年本年以及2019年往前推三年和2019年往前推五年，基於人工智能或者機器學習方法量化方法的影響。最主要的資訊，往前倒五年，會看到人工智能+量化總體回報率最高；但三年的時候（收益）就還好，但是好的程度沒有那麽高了。2019年單年，人工智能、機器學習的模型本身的表現不如市場上原有的傳統模型。

近期一個比較熱烈的討論是，GPT4是不是在選股方面可以表現得更好？是不是將來我們就可以直接拿大模型代替投資經理？2024年5月摩根大通釋出了IndexGPT，透過IndexGPT可以建立一個主題投資籃子，芝加哥大學的一個研究發現GPT4在選股方面可以超越大部份的人類分析師，可以提供更高的Alpha和夏普比例，這是非常引發關註的一個研究，但對這一研究發現也存在質疑。最主要的問題是表現好可能是因為訓練數據被汙染，也就是測試的數據是到2021年，但訓練數據是否包含了2021年以後的數據的問題。

第四個領域，智能投顧。對於人工智能在數碼金融當中的套用，還有一個很高的期待，就是智能投顧。因為投資的管理，往往財富管理更多是集中在高凈值人群上，大眾甚至中產階級往往不能得到很好的服務。那麽，智能投顧能不能幫我們解決投資難的問題？中國經過幾十年高速度的發展，財富管理有沒有可能也更普惠一些，讓中產階級甚至大眾都能得到優質的理財服務呢？

智能投顧的作用可能要取決於以下幾方面問題的答案：

第一，真的降低資產配置的成本；

第二，要能夠為客戶真實地客製個人化的服務，能夠粘住這個客戶；

第三，既然它是自助式的智能投顧，客戶自己操作的成本要比較低。

目前，中國金融機構在智能投顧方面已經有了不少有益的嘗試，但仍然存在不少挑戰。一是演算法本身會有諸多的局限性；二是千人千面對數據以及計算能力都有諸多要求；三是再好也好不過市場的總體環境，市場的總體環境會決定收益率；四是目前的投資者教育不足。我們看到，一些金融機構在投資者教育方面也加大了力度，未來人工智能在智能投顧方面的套用還有很大的空間。

介紹人工智能在數碼金融四個經典場景中套用的時候，我們也要看到其中還存在不少挑戰。

第一，演算法局限性的問題。知其然不知其所以然，如果用在分析客戶情緒、回答客戶問題的場景中，也許出錯成本不算高。但是，在涉及大量資金的核心業務上，比如對大額信貸資金的發放，完全不懂得演算法規律是非常危險的做法。這是因為現有的預測模型往往是基於歷史資訊，如果未來發生一個重要的結構性的變化就可能帶來重大損失。例如2020年對沖基金在疫情中表現差強人意，就和模型無法事先預測到巨大的結構性變化分不開。

第二，數據的局限性。運用人工智能模型的時候，不能忽略數據局限性帶來的問題。這是因為數據很多時候不是為了人工智能的目標生成的，往往是這個企業自己業務的一個副產品。企業為了讓業務順利發展會不斷調整模型參數，這就導致從數據觀察到的變化，究竟是外部環境發生變化還是內部模型變化帶來的，無法分清楚，這會進一步加大利用數據做預測的難度。二是數據質素可能達不到相應目標的要求。要防止「垃圾進、垃圾出」，需要在訓練模型時，就采用大量高質素的數據。中國雖然是數據要素非常豐富的國家，但是根據國際數據公司（International Data Cooperation）的研究，中國目前的數據主要是娛樂類數據，而工業用的、可以提升生產率的數據占比較低。在采用大模型時，需要考慮到對應的場景是否有足夠高質素的數據的問題，以避免「巧婦難為無米之炊」的困境。

第三個問題是人工智能的演算法安全，目前還是在一個非常初級的階段。在演算法安全方面，存在透過給大語言模型一些指令，讓大語言模型做一些違背開發者規則的事情的現象。例如2023年以「奶奶漏洞」為代表的越獄指令，是一位工程師對ChatGPT說，自己和祖母的感情深厚，現在我祖母去世了，她每天在我睡覺之前都給我念windows序列號。透過這段對話，該工程師獲得了真實的序列號。當然後來這個漏洞很快就被彌補，但核心問題是，現有的大語言模型的開發者對於演算法安全自身還沒有完全的把握。因此，在金融領域中，涉及核心業務的大規模套用應采取謹慎態度。

總結而言，目前人工智能在數碼金融當中的廣泛套用主要是四個領域，其中比較成熟的是客戶服務和數碼信貸方面。如果能夠處理好演算法安全與監管等問題，人工智能在數碼金融方面的廣泛套用仍有廣闊前景。

沈艷，北京大學國家發展研究院教授、北京大學數碼金融研究中心副主任。沈艷教授的主要研究領域包括大數據和互聯網金融、理論和實證計量經濟學、微觀金融、社會經濟狀況等。