清华大学申请基于扩散模型的多样化模仿学习方法、装置及智能体专利，解决智能体策略单一，难以处理多样性人类行为数据等问题

2024-02-06科学

金融界2024年2月3日消息，据国家知识产权局公告，清华大学申请一项名为「基于扩散模型的多样化模仿学习方法、装置及智能体「，公开号CN117494789A，申请日期为2023年11月。

专利摘要显示，本申请涉及人工智能技术领域，特别涉及一种基于扩散模型的多样化模仿学习方法、装置及智能体，其中，方法包括：检测智能体的当前状态；利用扩散模型生成当前状态的参考动作，并根据参考动作和当前状态选择目标模型，其中，目标模型包括扩散模型或常规策略模型；若目标模型为扩散模型，则控制智能体执行参考动作，若目标模型为常规策略模型，则控制智能体执行常规策略模型生成的动作。由此，解决了相关技术中智能体策略单一，从而难以处理多样性人类行为数据，且智能体对于环境变化的适应性较差，使得在不同环境状态下稳定性较低等问题。