編輯:編輯部
【新智元導讀】谷歌提出了一種新的基於ML的大氣環流模型NeuralGCM,比傳統的基於物理的模型節省了幾個數量級的計算量,計算成本降低了10萬倍,相當於高效能計算領域25年的進步速度。對於2-15天的天氣預報,這種方法比SOTA物理模型還要準確。
今天一早,谷歌CEO劈柴在X上釋出貼文,宣告NeuralGCM在氣候建模領域取得了重大突破!
「NeuralGCM將基於物理的建模與人工智能相結合,在模擬大氣方面的效率比其他模型高出10萬倍,為科學家提供了預測氣候變遷的新工具。」
這項研究成果也被刊登在了Nature上,研究團隊大部份來自Google Research和DeepMind,還有MIT、哈佛和ECMWF的科學家。
論文地址:https://www.nature.com/articles/s41586-024-07744-y
谷歌開發的這個名為NeuralGCM的模型,能夠快速、高效且準確地模擬地球大氣。
其意義在於,在地球正以前所未有的速度變暖的當下,幫助科學家對地球氣候做出準確的預測——
全球氣溫升高會使哪些地區面臨長期幹旱?哪些地方會因大型熱帶風暴而使沿海洪水更加頻繁?隨著氣溫上升,野火季節將如何變化?
面對這些亟待解決的問題,傳統的基於物理的大氣環流模型(General Circulation Model,GCM)顯得有些捉襟見肘,GCM在面對長期天氣和氣候模擬時,缺乏足夠的穩定性。
而NeuralGCM是一種基於機器學習的方法,結合了傳統的物理建模,大大提高了模擬的準確性和效率。
這種方法生成的2-15天的天氣預報比目前最先進的物理模型更準確,並且比傳統的大氣模型更準確地再現了過去40年的氣溫。
它標誌著在開發更強大、更易使用的氣候模型方面邁出了重要一步。
NeuralGCM模擬了2019年12月26日至2020年1月8日期間的特定濕度(specific humidity)變化模式
NeuralGCM變革氣候建模
盡管傳統氣候模型在過去幾十年中有所改進,但由於科學家對地球氣候執行機制和模型構建方式的理解不完全,它們往往會產生誤差和偏差。
這些模型將地球從地表到大氣層的這部份空間,劃分成邊長為50-100公裏的立方體,然後預測每個立方體在一段時間內的天氣變化。
然後,模型根據公認的物理定律 計算空氣和水分的運動,這也就是天氣預報的基本原理。
但問題在於,50-100公裏這個尺度實在是太大了。
許多重要的氣候過程,包括雲和降雨,在比當前模型使用的立方體尺寸更小的尺度上變化(毫米到公裏)。
而且,科學家們對某些過程(如雲的形成)的物理理解也不完整。
因此,這些傳統模型不僅依賴於基本原理,還使用簡化模型生成稱為「參數化」的近似值來模擬小尺度和不太了解的過程。
這些簡化的近似值不可避免地降低了基於物理的氣候模型的準確性。
那麽,NeuralGCM是怎麽解決這一難題的呢?
像傳統模型一樣,NeuralGCM仍然將地球大氣劃分為立方體,並對大規模過程(如空氣和水分運動)的物理進行計算。
不同的是,NeuralGCM不再依賴科學家制定的「參數化」近似值來模擬小尺度天氣變化,而是使用神經網絡從現有天氣數據中學習這些事件的物理原理。
NeuralGCM的一個關鍵創新,是用JAX 從頭重寫了大規模過程的數值求解器。
這使得研究人員能夠使用基於梯度的最佳化,來線上調整耦合系統在多個時間步長上的「線上」行為。
相比之下,之前嘗試使用機器學習增強氣候模型的努力在數值穩定性方面遇到了很大困難,因為它們使用「離線」訓練,忽略了隨著時間積累的小尺度和大尺度過程之間的重要反饋。
將整個模型用JAX編寫的另一個好處是它可以在TPU和GPU上高效執行,而傳統的氣候模型大多在CPU上執行。
NeuralGCM結合了傳統的流體動力學求解器和用於小尺度物理的神經網絡,這些元件透過一個微分方程式求解器組合在一起,使系統按時間順序推進
谷歌團隊使用了1979年至2019年間ECMWF的天氣數據,在0.7°、1.4°和2.8°分辨率下訓練了一系列NeuralGCM模型。
雖然NeuralGCM是基於天氣預報數據訓練的,但團隊設計NeuralGCM為一個通用的大氣模型。
精準的天氣預報和氣候預測
最近的地球大氣機器學習(ML)模型,包括Google DeepMind
的GraphCast,已經在天氣預測方面展示了革命性的準確性。
迄今為止,ML預測的研究主要集中在短期預測上,遠未達到氣候預測所需的數年到數十年時間。
由於數十年的氣候預測難以得到可靠驗證,谷歌團隊評估了NeuralGCM在氣候尺度預測方面的表現,並使用已建立的WeatherBench 2基準將其作為一個天氣模型進行了評估。
NeuralGCM在0.7°分辨率下的確定性模型(deterministic model)在天氣預報準確性方面與當前最先進的模型相當,天氣預報準確度可達 5 天。
然而,確定性模式缺乏所需的量化不確定性,無法在較長的準備時間內做出有用的預報。
預報集合從略微不同的起始條件生成,以產生一系列同樣可能的天氣情況。這些集合產生的概率天氣預報通常比確定性預報更準確。
NeuralGCM在1.4°分辨率下的整合模型(ensemble model),在5至15天的預測準確性方面優於之前的SOTA。
這種效能提升,得益於NeuralGCM生成的是集合天氣預測,後者能和ECMWF基於物理的SOTA模型ECMWF-ENS相媲美。
在已釋出的ML模型中,NeuralGCM是第一個做到這一點的。
在2至15天的預測中,NeuralGCM的集合預測有95%的時間比ECMWF-ENS更準確。
NeuralGCM在氣候時間尺度預測方面,NeuralGCM也優於最先進的大氣模型。
由於NeuralGCM僅模擬地球氣候的大氣成分,谷歌團隊將其效能與基於物理的大氣模型進行了比較。
在預測1980年至2020年間的溫度時,NeuralGCM的2.8°確定性模型的平均誤差,是大氣模型(AMIP)誤差的三分之一,即0.25 vs. 0.75攝氏度。
對比NeuralGCM和AMIP在1980年至2020年間預測1000 hPa全球平均溫度的表現
由於傳統的大氣模型在模擬地球大氣的某些方面存在困難,氣候科學家有時會使用更高分辨率的模型,如X-SHiELD,這些模型雖然更準確,但計算成本較高。
與X-SHiELD相比,NeuralGCM的1.4°確定性模型在預測2020年的濕度和溫度數據時誤差減少了15-50%,這些數據由美國國家海洋及大氣管理局(NOAA)提供。
在2020年的氣候模擬期間,NeuralGCM還預測了熱帶氣旋模式,這些模式與當年在相同區域觀察到的風暴數量和強度相匹配。
NeuralGCM是第一個能夠生成此類模式的基於機器學習的模型。
NeuralGCM預測了2020年全球範圍內的熱帶氣旋路徑(預測的風暴數量和強度與ECMWF再分析v5(ERA5)數據集中記錄的實際氣旋數量和強度相匹配)
開放、快速、高效
NeuralGCM在計算速度和成本上比傳統的基於物理的氣候模型快了幾個數量級。
其1.4°模型比X-SHiELD快3500多倍,這意味著如果研究人員用X-SHiELD模擬一年的大氣,需要20天,而用NeuralGCM只需8分鐘。
而且,科學家只需要一台帶有單個TPU(張量處理單元,Tensor Processing Unit)的電腦就能執行NeuralGCM,而執行X-SHiELD則需要請求使用擁有13000個CPU(中央處理單元,Central Processing Unit)的超級電腦。
總體而言,使用NeuralGCM進行氣候模擬的計算成本比X-SHiELD低10萬倍,相當於高效能計算領域25年的進步速度。
在此圖表中,NeuralGCM和兩個物理模型NCAR CAM、NOAA X-SHiELD同場競技,對比它們在30秒計算時間內生成的大氣模擬天數。
這三個模型分別以不同的分辨率執行,其中X-SHiELD的分辨率最高(0.03°),NCAR CAM6的分辨率為1.0°,NeuralGCM的分辨率最低(1.4°)。
值得一提的是,盡管NeuralGCM以低分辨率執行,但其準確性與高分辨率模型相當。
那麽,在準確性相當的情況下,可以看到,NeuralGCM在30s的時間內,就能夠生成22.8天的大氣模擬,而X-SHiELD作為一個必須在超級電腦上執行的高分辨率物理模型,則只能生成9分鐘!
這也讓之前因計算成本較低而頗受研究人員青睞的NCAR CAM6的優勢蕩然無存。
谷歌團隊已在GitHub上公開了NeuralGCM的原始碼和模型權重,供非商業用途。他們希望其他研究人員可以輕松添加新元件來測試假設並改進模型功能。
此外,由於NeuralGCM可以在筆記電腦上執行,而不需要超級電腦的支持,因此更多的氣候研究人員能夠在他們的工作中使用這一最先進的模型。
結論和未來方向
NeuralGCM目前僅對地球大氣進行建模,但谷歌團隊希望最終將地球氣候系統的其他方面,如海洋和碳迴圈,納入模型。
透過這種方式,NeuralGCM將能夠在更長的時間尺度上進行預測,不僅可以預測幾天和幾周的天氣,還能在氣候時間尺度上進行預測。
總而言之,NeuralGCM提出了一種構建氣候模型的新方法,這種方法可能比現有模型更快、計算成本更低且更準確。
參考資料:
https://www.nature.com/articles/s41586-024-07744-y
https://research.google/blog/fast-accurate-climate-modeling-with-neuralgcm/
https://x.com/sundarpichai/status/1815512751793721649