当前位置: 华文世界 > 科学

清华大学申请基于扩散模型的多样化模仿学习方法、装置及智能体专利,解决智能体策略单一,难以处理多样性人类行为数据等问题

2024-02-06科学

金融界2024年2月3日消息,据国家知识产权局公告,清华大学申请一项名为「基于扩散模型的多样化模仿学习方法、装置及智能体「,公开号CN117494789A,申请日期为2023年11月。

专利摘要显示,本申请涉及人工智能技术领域,特别涉及一种基于扩散模型的多样化模仿学习方法、装置及智能体,其中,方法包括:检测智能体的当前状态;利用扩散模型生成当前状态的参考动作,并根据参考动作和当前状态选择目标模型,其中,目标模型包括扩散模型或常规策略模型;若目标模型为扩散模型,则控制智能体执行参考动作,若目标模型为常规策略模型,则控制智能体执行常规策略模型生成的动作。由此,解决了相关技术中智能体策略单一,从而难以处理多样性人类行为数据,且智能体对于环境变化的适应性较差,使得在不同环境状态下稳定性较低等问题。

本文源自金融界