基于机器学习的航天器规避目标威胁博弈决策

张鸿林; 罗建军<sup>*</sup>; 马卫华

摘要

针对航天器规避空间目标抵近威胁的决策问题，提出了一种智能决策框架和基于深度强化学习的自主决策方法。考虑到空间目标的机动特性和威胁规避的博弈性，基于“感知-判断-决策-执行”(OODA)环决策思想和机器学习方法，提出了一种航天器威胁规避智能博弈决策框架。基于该框架和对空间目标运动意图的推理，为了使航天器决策控制具备博弈应对能力，设计了基于深度强化学习的航天器机动决策算法和训练环境，实现了对空间目标典型运动意图的规避应对；进一步地，采用自我博弈学习训练提升航天器自主机动决策算法的泛化性和应对目标不确定机动的适应能力。最后，通过算例仿真及分析，验证了所提方法的有效性。

出版日期2023
单位西北工业大学; 航天学院

收藏分享被引浏览

更新时间：2024-01-09 22:53

基于机器学习的航天器规避目标威胁博弈决策

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友