當前位置: 華文世界 > 科技

沈艷:人工智能在數碼金融中的套用

2024-08-28科技

題記: 2024年7月3日,2024中國數碼經濟發展和治理學術年會在清華大學成功舉辦。北京大學國家發展研究院教授、北大數碼金融中心副主任沈艷以【人工智能在數碼金融中的套用】為題進行了主旨演講。本文根據沈艷教授現場發言內容整理。


很榮幸受邀,謝謝葉老師剛剛的介紹。我今天的主題是「人工智能在數碼金融中的套用」,並拋磚引玉,提供一些思考。我們的大背景是,2023年10月總書記提出來的五篇大文章當中,特別提到要做好數碼金融大文章。


先介紹一下什麽是數碼金融。它是過去十多年當中金融體系裏面最重要的創新,主要是利用數碼技術為我們在支付、貸款、保險、投資等方面的新金融工具、金融模式,也包括金融基礎設施建設。

我認為可以從三個維度去理解數碼金融的發展變化:

  • 第一個維度刻畫金融部門,包括貨幣以及支付、信貸、保險、資產管理以及外匯等相關機構與業務活動。

  • 第二個維度是數碼技術,涉及到AI、區塊鏈、雲端運算等等。今天討論的AI,很多時候是把很多數碼技術包含在內探討,比如在運用人工智能時,也離不開大數據、區塊鏈、雲端運算、算力等的討論。

  • 第三個維度是商業模式,比如B2C、B2B、P2P、B2G,以及平台本身多邊的模式。

  • 當我們講創新的時候指的是什麽呢?可能主要是在今天我們考慮人工智能的時候,涉及的是場景、數據、演算法、算力,他們在改善金融服務方面的作用。金融服務包括四個維度:改善金融的觸達、提高金融的效率、能不能提升我們的風控,以及金融安全的問題。其中,金融安全的問題既包含程式套用的安全,也包括是否觸發金融風險。

    我主要從四個領域來簡介人工智能在數碼金融當中的套用。

    首先是智能客服。銀行常常要面對使用者大量的業務咨詢,因此往往需要龐大的客服群體。但是,客戶咨詢在時間上的分布並不均勻,可能很多時候沒有人打電話,人員過多構成浪費;但是人員過少又會在高峰期無法快速回應客戶的需求,造成客戶體驗差的現象。另外,年輕人離職率也很高,銀行也面臨好不容易培訓上手的客服用不了多久就流失的現象。某金融集團的智能服務在一年中共有超過10億次客服的回答量,他們的智能語音服務可以覆蓋其中的86%,解決率達到92.3%。這就極大提升了服務效率。然後,客戶與智能客服的對話形成新的文本,進一步分析這些文本可以開展智能服銷業務,進一步向潛在客戶推薦相應的金融產品。2021年實作了1000多億近2000億的智能服銷的成果。

    第二個領域,數碼信貸。長久以來,小微企業和個人面臨「貸款貴、貸款難」問題,金融存在不夠普惠的現象。相較於大企業,中小微企業和銀行等金融機構之間的資訊不對稱更不易於解決。事前防範「逆選擇」風險和事後防範「道德風險」,均需要金融機構能以較低成本來做好上述風控。人工智能能夠幫助我們在數碼信貸方面有所作為。一方面,利用平台可以獲取大數據,降低客戶獲取的難度;基於大數據可以和恰當的機器學習模型相結合的新的風控模型,可以提升事前風控能力、降低逆選擇風險。另一方面,平台可以用較低成本獲取客戶再貸款之後的一些行為和交易資訊,這也有助於做好貸款管理,防範道德風險。微眾、網商這樣的互聯網銀行,以非常少的人員來服務非常多的客戶,這是人工智能用在模型的預測以及還款能力的預測等方面的套用,這也是相對比較成熟的技術套用。


    第三個領域,量化投資。量化當中的套用,首先是投資資訊的搜集。其次,會透過人工智能的模型對交易習慣做一些學習。再次,做大模型的一些預測,看看能不能夠提升數據,做到因子的提取,做到降維。全球用AIML(人工智能標示語言)、人工智能或者是機器學習這一類對沖基金的占比,從2010年到2018年一直是增加的,但是2019年以後就開始下降。收益率做了一個比對,2019年本年以及2019年往前推三年和2019年往前推五年,基於人工智能或者機器學習方法量化方法的影響。最主要的資訊,往前倒五年,會看到人工智能+量化總體回報率最高;但三年的時候(收益)就還好,但是好的程度沒有那麽高了。2019年單年,人工智能、機器學習的模型本身的表現不如市場上原有的傳統模型。


    近期一個比較熱烈的討論是,GPT4是不是在選股方面可以表現得更好?是不是將來我們就可以直接拿大模型代替投資經理?2024年5月摩根大通釋出了IndexGPT,透過IndexGPT可以建立一個主題投資籃子,芝加哥大學的一個研究發現GPT4在選股方面可以超越大部份的人類分析師,可以提供更高的Alpha和夏普比例,這是非常引發關註的一個研究,但對這一研究發現也存在質疑。最主要的問題是表現好可能是因為訓練數據被汙染,也就是測試的數據是到2021年,但訓練數據是否包含了2021年以後的數據的問題。


    第四個領域, 智能投顧。 對於人工智能在數碼金融當中的套用,還有一個很高的期待,就是智能投顧。因為投資的管理,往往財富管理更多是集中在高凈值人群上,大眾甚至中產階級往往不能得到很好的服務。那麽,智能投顧能不能幫我們解決投資難的問題?中國經過幾十年高速度的發展,財富管理有沒有可能也更普惠一些,讓中產階級甚至大眾都能得到優質的理財服務呢?


    智能投顧的作用可能要取決於以下幾方面問題的答案:

  • 第一,真的降低資產配置的成本;

  • 第二,要能夠為客戶真實地客製個人化的服務,能夠粘住這個客戶;

  • 第三,既然它是自助式的智能投顧,客戶自己操作的成本要比較低。


  • 目前,中國金融機構在智能投顧方面已經有了不少有益的嘗試,但仍然存在不少挑戰。一是演算法本身會有諸多的局限性;二是千人千面對數據以及計算能力都有諸多要求;三是再好也好不過市場的總體環境,市場的總體環境會決定收益率;四是目前的投資者教育不足。我們看到,一些金融機構在投資者教育方面也加大了力度,未來人工智能在智能投顧方面的套用還有很大的空間。

    介紹人工智能在數碼金融四個經典場景中套用的時候,我們也要看到其中還存在不少挑戰。

    第一,演算法局限性的問題。知其然不知其所以然,如果用在分析客戶情緒、回答客戶問題的場景中,也許出錯成本不算高。但是,在涉及大量資金的核心業務上,比如對大額信貸資金的發放,完全不懂得演算法規律是非常危險的做法。這是因為現有的預測模型往往是基於歷史資訊,如果未來發生一個重要的結構性的變化就可能帶來重大損失。例如2020年對沖基金在疫情中表現差強人意,就和模型無法事先預測到巨大的結構性變化分不開。

    第二,數據的局限性。運用人工智能模型的時候,不能忽略數據局限性帶來的問題。這是因為數據很多時候不是為了人工智能的目標生成的,往往是這個企業自己業務的一個副產品。企業為了讓業務順利發展會不斷調整模型參數,這就導致從數據觀察到的變化,究竟是外部環境發生變化還是內部模型變化帶來的,無法分清楚,這會進一步加大利用數據做預測的難度。二是數據質素可能達不到相應目標的要求。要防止「垃圾進、垃圾出」,需要在訓練模型時,就采用大量高質素的數據。中國雖然是數據要素非常豐富的國家,但是根據國際數據公司(International Data Cooperation)的研究,中國目前的數據主要是娛樂類數據,而工業用的、可以提升生產率的數據占比較低。在采用大模型時,需要考慮到對應的場景是否有足夠高質素的數據的問題,以避免「巧婦難為無米之炊」的困境。

    第三個問題是人工智能的演算法安全,目前還是在一個非常初級的階段。在演算法安全方面,存在透過給大語言模型一些指令,讓大語言模型做一些違背開發者規則的事情的現象。例如2023年以「奶奶漏洞」為代表的越獄指令,是一位工程師對ChatGPT說,自己和祖母的感情深厚,現在我祖母去世了,她每天在我睡覺之前都給我念windows序列號。透過這段對話,該工程師獲得了真實的序列號。當然後來這個漏洞很快就被彌補,但核心問題是,現有的大語言模型的開發者對於演算法安全自身還沒有完全的把握。因此,在金融領域中,涉及核心業務的大規模套用應采取謹慎態度。

    總結而言,目前人工智能在數碼金融當中的廣泛套用主要是四個領域,其中比較成熟的是客戶服務和數碼信貸方面。如果能夠處理好演算法安全與監管等問題,人工智能在數碼金融方面的廣泛套用仍有廣闊前景。

    沈艷,北京大學國家發展研究院教授、 北京大學數碼金融研究中心副主任 。沈艷教授的主要研究領域包括大數據和互聯網金融、理論和實證計量經濟學、微觀金融、社會經濟狀況等。