基于多智能体强化学习值分解的优化算法

王慧琴; 苗国英; 孙英博

doi:10.19651/j.cnki.emt.2211181

摘要

当前多智能体强化学习在值分解的算法中无法充分考虑到多智能体间的协作关系，并且使用的随机策略在探索过程中容易出现越过最优点，陷入局部最优解的情况。针对以上问题，本文提出了一种深度交流多智能体强化学习算法。本文通过使用卷积和全连接结构在值分解网络中设计了一种通信机制以此来增强多智能体之间的协作。接着，本文提出了一种新的自适应探索策略，为了平衡数据探索与利用之间的矛盾，加入了周期性的衰减策略。最后，通过仿真结果验证了本文提出方法在部分场景中达到25.8%的性能提升，提高了多智能体的合作能力。

出版日期2023
单位自动化学院; 南京信息工程大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 02:56

基于多智能体强化学习值分解的优化算法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友