來源:【四川日報-川觀新聞】
川觀新聞記者 王國平
「這是全球第一個億級參數量的地震波大模型,今天正式釋出。」7月28日,由國家超級計算成都中心、中國地震局地球物理研究所與清華大學聯合開發的「諦聽」地震波大模型正式釋出。
出席活動的四川省地震局副局長杜斌表示,四川作為經濟和能源大省,地質構造復雜,是中國地震活動水平最高、強度最大的地區之一。此次「諦聽」地震波大模型的釋出不僅是地震科學技術的重大突破,也是對國家重大戰略需求的積極回應。
諦聽地震波大模型釋出現場。
如何練出聽震「神獸」?
「‘諦聽’原本是中國神話傳說中的神獸,可以透過聽音來辨認世間萬物。」中國地震局地球物理研究所副所長陳石說,「我們研發的‘諦聽’,是一種大型地震學數據集以及在此基礎上訓練的人工智慧大模型。」
釋出會上,陳石如此解釋「諦聽」的來歷:它們都是透過「聽」去認識、分析自然界中的資訊。
陳石說,隨著中國地震監測體系的持續最佳化升級以及近年來人工智慧技術的迅猛發展,地震學研究和防震減災工作也進入了地震波大數據時代,「諦聽」地震波大模型應運而生。
那如何訓練這只可以辨識地震的「神獸」?
首先要有數量足夠的數據,這就是「諦聽」數據集。最初,科研團隊將2013年至2020年間的震相觀測報告和國家測震台網數據備份中心的數據,經過清洗和脫敏處理後,建立了1.0版本的「諦聽」數據集。隨著數據規模的擴大,2023年9月,成都產業集團營運的國家超算成都中心與中國地震局地球物理研究所達成戰略合作,雙方合作共建「地震大模型創新套用聯合實驗室」,新一代「諦聽」數據集正式落戶成都。
數據集是大模型訓練的基礎,數據集的規模和品質直接決定了模型的訓練效果。目前,「諦聽」數據集不僅是國內第一個,同時也是目前國內外最大規模、樣本型別和標註最為全面的地震學專業AI訓練數據集之一。
陳石介紹,第一版「諦聽」地震波大模型基於2300萬條地震事件波形進行了預訓練,而中國中國地震台網每年產生的標註事件波形約為50萬條。以此計算,剛「出生」不久的「諦聽」地震波大模型已相當於擁有約40年地震訊號辨識經驗的「老專家」。
其次,是演算法、模型的設計和調優。來自清華大學自動化系的助理研究員劉暢博士介紹,作為全球範圍內地震波大模型的首次探索,需要進行大量基礎性研究,否則模型訓練不充分,實際套用效果不及預期。
簡單來說,演算法的選擇和設計直接決定了模型的學習能力和表達能力,演算法的最佳化和改進可以提高模型的效能和效果。參數則是大模型訓練的調節器,可直接影響模型的準確性和穩定性。在「諦聽」大模型中,參數的數量非常龐大,也給最優參數的確認造成極大的挑戰。
「人工智慧演算法的關鍵在於兩個因素,訓練數據量和模型參數量。」陳石用比喻來解釋:訓練數據量可以看作是演算法的「閱歷」,而參數量則是演算法的「腦容量」。要想有效地記憶和理解海量的地震數據,並充分挖掘和利用其中的資訊,就必須發展與之相匹配的大「腦容量」的大模型。
「諦聽」都能幹什麽?
據悉,目前「諦聽」地震波大模型已可投入使用。陳石談到,「諦聽」地震波大模型依托中國地震台網的海量數據,透過先進的人工智慧技術,在測試中發現,可以顯著提升地震訊號的辨識準確率和速度。
因此,從短期看,「諦聽」地震波大模型可直接套用於地震訊號辨識、地震活動監測、大地震快速響應等領域,有望減輕地震局一線業務人員的工作壓力。
從長期看,地震學是一門觀測科學,重大的突破往往來自對觀測數據的深刻理解。對觀測的理解越全面,對觀測的整合能力越強,離地震學科學問題的突破就越近。目前,傳統方法和中小模型均無法充分利用百TB、PB級別的地震觀測數據,而這些數據中蘊含著許多重要的地震學科學問題,只有大模型才能深入挖掘這些「寶藏」。因此,「諦聽」地震波大模型有望為地震科學研究帶來重大突破。
從套用領域看,「諦聽」地震波大模型的前景也十分令人期待。
「未來,該模型的套用場景還可用於礦震監測、頁巖氣開采、城市地下空間結構探測、海底地震監測等多個領域。」國家超算成都中心常務副主任王建波說。
以尋找油氣為例。目前全球95%以上的油氣田發現主要是依靠地震勘探。王建波說,地震波在不同介質中傳播時,強度、形態等特征都不同,「諦聽」地震波大模型透過學習儲存石油區域的波形特點,就可以推匯出地下是否含有油氣。
陳石表示,第一版「諦聽」地震波大模型完成了從預訓練到微調完整流程的從無到有的探索,初步展示了優於中小模型的效能,為後續充分挖掘和發揮地震波大模型的優勢探索了道路,積累了經驗。
「諦聽」之外,超算還能做什麽?
「發展地震波大模型不僅是人工智慧地震學領域的必然趨勢,也是該領域的科技制高點。」陳石說,「在具備了足夠的數據和算力基礎後,我們迅速組織團隊第一時間開展相關研究工作,力求填補這一重要空白,為地震科學研究和防震減災事業貢獻一份力量。」
成都數據集團黨委副書記、成都超算中心營運管理有限公司董事長郭黎表示,「諦聽」地震波大模型的研發,不僅極大地推動了人工智慧演算法在地震學領域的開發、測試和套用,更為地震監測預報業務的智慧化發展提供了堅實的技術支撐。
作為長期在超算領域工作的資深從業者,王建波認為,「諦聽」地震學數據集正式落戶國家超級計算成都中心地震大模型創新套用聯合實驗室,這是垂直領域專業數據和大規模算力深度融合、軟硬一體的一次新嘗試。
「‘諦聽’地震波大模型的釋出對於突破中小地震波模型效能瓶頸,提高地震大數據智慧處理能力和資訊挖掘水平具有重要意義。」王建波說,國家超算成都中心強大算力和技術服務能力,不僅可以滿足中國地震局地球物理研究所等科研單位客製化的軟硬一體的服務需求,更是為人工智慧和機器人等未來產業發展提供了堅實的平台保障。
目前國家超算成都中心已在多個領域形成特色算力套用。其中:在人工智慧大模型領域,國家超算成都中心與成都曉多科技合作,研發了基於大語言模型技術開發的垂類電商客服行業的大型語言模型,可為電商企業提供智慧化的服務和行銷一體化解決方案。今年5月,該模型成功透過國家生成式人工智慧服務備案。
國家超算成都中心。
在防災減災領域,中國科學院成都山地災害與環境研究所就聯合國家超算成都中心,開展了「氣候變遷條件下山地致災風險綠色調控關鍵技術與示範」計畫研究,搭建山地災害風險模擬與險情預報平台,突破精細化、精準化災害預警預報瓶頸。此外,國家超算成都中心還與四川氣象部門合作,提供精準氣象預報服務。
「國家超算成都中心還將不斷加速人工智慧技術在防災減災、城市治理等領域的套用與發展,充分發揮我們作為大國重器的戰略支撐作用。」王建波說。
國家超算成都中心供圖
本文來自【四川日報-川觀新聞】,僅代表作者觀點。全國黨媒資訊公共平台提供資訊釋出傳播服務。
ID:jrtt