改进DDPG算法在外骨骼机械臂轨迹运动中的应用

苏杰; 刘光宇; 暨仲明; 黄雨梦

doi:10.13873/J.1000-9787(2023)02-0149-04

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

改进DDPG算法在外骨骼机械臂轨迹运动中的应用

作者：苏杰; 刘光宇; 暨仲明; 黄雨梦

来源：传感器与微系统, 2023, 42(02): 149-160.

DOI：10.13873/J.1000-9787(2023)02-0149-04

摘要

针对现阶段外骨骼机器人轨迹运动时出现效果不佳的问题，提出了基于优先经验回放与分区奖励(PERDA)融合的深度确定性策略梯度(DDPG)强化学习算法，即PERDA-DDPG。该方法利用时间差分误差(TD-errors)的大小对经验排序，改变了原始采样的策略。此外，相较于以往二值奖励函数，本文根据物理模型提出针对化的分区奖励。在Open AI Gym平台上实现仿真环境，实验结果表明：改进的算法收敛速度提升了约9.2%,学习过程更加稳定。

出版日期2023
单位自动化学院; 杭州电子科技大学

全文

访问全文

收藏分享被引(2) 浏览

更新时间：2024-03-19 04:38

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号