摘要

针对在有静态障碍物环境下采用传统路径规划算法进行机械臂避障规划时,存在规划效率低的问题,提出一种基于深度强化学习的机械臂运动规划方法。首先,在分析机械臂数学模型和运动环境的基础上,使用Python构建机械臂仿真试验环境,并根据所建环境设置奖励函数、动作变量和状态变量;其次,针对机械臂运动中对于静态障碍物的规避问题,采用深度确定性策略梯度(DDPG)算法,并在单一障碍物与多个障碍物环境下进行仿真试验;最后,仿真试验结果表明,相较于快速搜索随机树(RRT)算法,提出的DDPG算法不仅将规划时间提高了95.0%,而且具有更高运动规划成功率。