摘要

在高端人工智能领域中,感知力和决策能力都是衡量智能水平的重要指标。将深度学习的感知能力与强化学习的决策能力相结合,使得智能体能够从高维的状态动作空间中感知信息,通过得到的信息对模型进行训练、做出决策,以能够通过端对端的学习方式来实现从原始输入到输出的直接控制。本文介绍了深度学习和强化学习基础知识;阐述了深度强化学习主流算法中的DQN及其变种和应用,分析了深度层次强化学习算法。最后对相关工作做了总结和展望。

全文