摘要

人机对抗是人工智能的热门领域,同时也为探索机器智能的内在原理与发展提供了途径。基于深度强化学习,讨论了人机智能对抗技术,并分析了人机对抗的内涵与机理。首先,简化了感知-判断-决策-行动(OODA)模型,总结了适用于深度强化学习的人机对抗框架,并归纳了态势认知、决策与优化以及协同与通信等关键技术;然后,阐述了态势特征提取与神经网络选择、策略制定与策略优化以及多智体训练模型与通信等技术内容;最后,列举了当前人机对抗的应用与挑战,并对人机对抗的未来发展做出了展望。

全文