场景图谱驱动目标搜索的多智能体强化学习

陆升阳; 赵怀林; 刘华平

摘要

针对强化学习在视觉语义导航任务中准确率低，导航效率不高，容错率太差，且部分只适用于单智能体等问题，提出一种基于场景先验的多智能体目标搜索算法。该算法利用强化学习，将单智能体系统拓展到多智能体系统上。主要包括两个方面，将场景图谱作为先验知识辅助智能体团队进行视觉探索，其次利用集中式训练分布式探索的多智能体强化学习的方法以大幅度提升智能体团队的准确率和工作效率。通过在AI2THOR中进行训练测试，并与其他算法进行对比证明此方法无论在目标搜索的准确率还是效率上都优先于其他算法。

出版日期2022-9-30
单位清华大学; 电子工程学院; 上海应用技术大学

收藏分享被引浏览

更新时间：2023-02-09 14:20

场景图谱驱动目标搜索的多智能体强化学习

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友