當前位置: 華文世界 > 科學

清華大學申請基於擴散模型的多樣化模仿學習方法、裝置及智能體專利,解決智能體策略單一,難以處理多樣性人類行為數據等問題

2024-02-06科學

金融界2024年2月3日訊息,據國家知識產權局公告,清華大學申請一項名為「基於擴散模型的多樣化模仿學習方法、裝置及智能體「,公開號CN117494789A,申請日期為2023年11月。

專利摘要顯示,本申請涉及人工智能技術領域,特別涉及一種基於擴散模型的多樣化模仿學習方法、裝置及智能體,其中,方法包括:檢測智能體的當前狀態;利用擴散模型生成當前狀態的參考動作,並根據參考動作和當前狀態選擇目標模型,其中,目標模型包括擴散模型或常規策略模型;若目標模型為擴散模型,則控制智能體執行參考動作,若目標模型為常規策略模型,則控制智能體執行常規策略模型生成的動作。由此,解決了相關技術中智能體策略單一,從而難以處理多樣性人類行為數據,且智能體對於環境變化的適應力較差,使得在不同環境狀態下穩定性較低等問題。

本文源自金融界