編輯:LRST 好困
【新智元導讀】近日,清華大學電子系城市科學與計算研究中心的研究論文【EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities】獲得自然語言處理頂會 ACL 2024傑出論文獎(Outstanding Paper Award)。該會議於2024年8月11日至16日在泰國曼谷舉辦,獲得此項榮譽的論文約占投稿論文總數的0.79%。
宏觀經濟學在上個世紀經歷了多次危機與發展。
從18世紀亞當·斯密古典宏觀經濟學中「看不見的手」到上世紀20~30年代美國大蕭條時期的肯恩斯革命,從二戰後山繆森的新古典綜合到70~80年代美國滯漲時期的貨幣主義,從新古典宏觀經濟學的理性預期到行為經濟學,尤其是2008年全球金融危機後,對宏觀經濟現象的研究越來越重視對人的復雜行為的準確建模。
20世紀末到21世紀初,基於代理的建模(Agent-based Modeling, ABM)在計算經濟學中受到一定程度的關註。
ABM強調了主流方法動態隨機一般均衡(DSGE)模型中「完美世界」假設的缺陷,旨在透過模擬微觀個體的行為及其互動自下而上地湧現出宏觀層面的典型化事實(Stylized facts),例如GDP增長與波動、通脹與失業率的權衡。
然而,由於個體行為規則需要專家設定,並帶來模型校驗、可解釋性有限的問題,ABM模擬在宏觀經濟學領域的發展一定程度上受限。
如今,大語言模型(LLM)的出現催生了各個領域的智慧體研究並取得了多方面的成功,驗證了LLM強大的推理與決策能力,這為模擬更真實的經濟個體提供了有效途徑。
論文連結:https://arxiv.org/abs/2310.10436v4
清華大學團隊的這項工作使用LLM構造EconAgent,在一個宏觀經濟系統中模擬了個體的工作與消費行為,並相較於傳統ABM模擬湧現出了更穩定、真實的典型事實(Stylized fact, 即經典的宏觀經濟現象)。
EconAgent與經濟模擬系統
論文第一作者為清華大學博士生李念,合作者包括清華大學李勇教授、高宸助理研究員、廖慶敏教授。
經濟模擬系統的構建
為盡可能保證經濟模擬的真實性,經濟系統包括了必要的經濟活動,包括個體、公司、政府、銀行等經濟物件,以及工作、消費、定價等經濟活動:
- 個體透過工作取得月收入;
- 政府按照稅收政策對所有個體征稅,並將稅收平均返還;
- 個體決定將稅收收入和儲蓄的一部份用於消費生活必需品;
- 個體的工作帶來必需品的生產供應,個體的消費帶來必需品的消費需求,結合當前的庫存,供需不平衡會帶來消費市場與勞動市場的動態變化,即商品價格與個體薪資的變動;
- 每年個體在銀行的儲蓄得到一些利息;銀行透過常用的Taylor Rule進行每年的利率調整。
EconAgent智慧體設計
為了使EconAgent能根據自身與外部的經濟狀況作出合理決策,研究者進行了如下幾方面設計。
首先,在prompt中賦予了個體差異化的、基於現實世界的畫像,包括年齡、姓名、職業等,使得每個個體都具有獨特的特征和背景,從而能夠模擬真實世界中個體的多樣性和復雜性。
其次,prompt中描述了真實經濟環境中的生活場景,使得EconAgent夠感知與理解經濟環境中的資訊及其變化趨勢,從而作出正確合理的響應。進一步地,研究者對智慧體設計了記憶模組,以模擬廣泛的宏觀經濟趨勢對個體決策的影響;
如此一來,EconAgent不僅能夠感知當前的經濟環境,還能夠考慮市場環境的歷史變化和長期趨勢。
最後,EconAgent綜合考慮多類經濟因素做出自主決策,不依賴於預定義的規則。
反思prompt與結果:個體能感知勞動市場與消費市場的變化
實驗結果:宏觀經濟現象與規律的自主湧現
研究者模擬了一個百人經濟系統,每個模擬步代表一個月,共進行了20年的模擬,從宏觀經濟指標與經濟規律兩個方面對模擬結果進行驗證,並與基於規則的ABM模擬[1,2]以及RL方法[3]進行對比。
1. 宏觀經濟指標:通脹率、失業率、名義GDP、名義GDP增長率
實驗結果表明,基於EconAgent的模擬湧現出數值更合理、波動更穩定的宏觀經濟指標。例如,通脹率不超過10%、在第3年後基本達到穩定。
宏觀經濟指標
2. 宏觀經濟規律:Phillips Curve、Okun’s Law
實驗結果表明,基於EconAgent的模擬湧現出更合理的經濟規律,而其它方法的結果出現了錯誤的Phillips Curve:失業率與薪資通脹率並不是負相關關系。
宏觀經濟規律
EconAgent的決策行為分析
為進一步探究EconAgent所做的決策是否符合真實世界的經濟常識,研究者對其工作與消費決策進行多個經濟因素的回歸分析。
結果表明,當稅收越少、政府返還越多、預期收入越高時,工作意願越高;當儲蓄越高、上個月消費越少時,消費占儲蓄比例越低,意味著EconAgent會保持穩定的消費水平;此外,商品價格也是影響工作與消費意願的重要因素。以上結論均與現實世界中的人類行為相吻合。
研究者進一步研究EconAgent是否自主地表現出決策機制中的異質性。
上圖(a)展示了消費傾向隨年齡增長而逐步增加,這與在傳統宏觀經濟研究中觀察到的經驗規律大體一致[4]。
研究者透過與EconAgent的互動,進一步解讀了Phillips Curve中出現負相關的可能原因。首先,計算失業率最高和最低的兩年中所有Agent的平均消費傾向。
上圖(b)展示了比較結果,其中***表示顯著差異(p < 0.001),可以觀察出高失業率導致消費傾向顯著降低。
為了更深入地了解在高失業率的勞動市場中選擇減少消費的原因,隨機選擇一個Agent,並基於在失業率最高的那一年的行為決策歷史,結合每個季度的經濟動態,為所做出的消費決策提供理由。以下結果表明,Agent對宏觀經濟趨勢有所感知,在面對高失業率下的勞動市場通貨緊縮時,會選擇謹慎消費。
研究者進一步探究了重要事件對EconAgent行為的影響以及由此產生的宏觀經濟模擬結果的變化,這也是許多ABM研究中廣泛討論的一個話題[5]。
以對全球經濟產生重大影響的COVID-19為例,研究者透過prompt的方式將其納入模擬中,如下所示:
下圖對比了失業率的變化情況,其中「Normal」和「COVID-19」分別表示有無上述提示的模擬結果。
結果表明基於EconAgent的模擬成功地復現了全球失業率的增長,盡管數值與真實數據並不完全匹配,但這表明所提出的框架能夠定性模擬重要事件對宏觀經濟產生的影響。
以下是EconAgent的反思範例。
進一步地,研究團隊將EconAgent與研發的OpenCity智慧體平台[6]相結合,基於EconAgent驅動北京真實街區中的個體工作、消費行為,與企業的生產行為等經濟活動的模擬仿真。
總結與展望
總而言之,該論文工作結合LLM智慧體與經濟模擬,為計算經濟學的研究範式開辟了一條新的可能道路,未來有望以DSGE等主流模型為目標,向更精準、更真實的模擬邁進。
進一步地,關於大語言模型智慧體ABM模擬及其在社會、經濟、物理、網路等領域套用的相關工作,團隊還釋出了首篇綜述論文:【Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspectives】,該論文已被Humanities and Social Sciences Communications接收。