改进的自校正Q学习应用于智能机器人路径规划

任伟; 朱建鸿<sup>*</sup>

doi:10.13433/j.cnki.1003-8728.20230157

摘要

为了解决智能机器人路径规划中存在的一些问题，提出了一种改进的自校正Q学习算法。首先，对其贪婪搜索因子进行了改进，采用动态的搜索因子，对探索和利用之间的关系进行了更好地平衡；其次，在Q值初始化阶段，利用当前位置和目标位置距离的倒数代替传统的Q-learning算法中的全零或随机初始化，大大加快了收敛速度；最后，针对传统的Q学习算法中Q函数的最大化偏差，引入自校正估计器来修正最大化偏差。通过仿真实验对提出的改进思路进行了验证，结果表明，改进的算法能够很大程度的提高算法的学习效率，在各个方面相比传统算法都有了较大的提升。

出版日期2023
单位江南大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-01-08 18:59

改进的自校正Q学习应用于智能机器人路径规划

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友