一种基于元学习的改进深度强化学习算法

黄宁馨; 尹翔<sup>*</sup>; 乐云亮; 彭坤彦

doi:10.19411/j.1007-824x.2021.03.004

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

一种基于元学习的改进深度强化学习算法

作者：黄宁馨; 尹翔^*; 乐云亮; 彭坤彦

来源：扬州大学学报(自然科学版), 2021, 24(03): 19-23.

DOI：10.19411/j.1007-824x.2021.03.004

摘要

传统的深度强化学习算法在解决任务时与环境交互量大且样本复杂度高,导致智能体的训练时间长,算法难以收敛,故在实际问题中的应用受限.针对该问题,在智能体采用梯度下降方法更新模型参数的过程中融入元学习思想,提出一种改进的深度强化学习算法,使得智能体利用在训练任务中学习到的先验知识快速地适应新任务.仿真结果表明:改进的深度强化学习算法可实现智能体在新任务上的快速适应,其收敛速度和稳定性等均优于传统算法.

出版日期2021

全文

访问全文

收藏分享被引(3) 浏览

更新时间：2024-04-17 18:12

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号