摘要

在RoboCup仿真2D系统中,智能体很难在实时动态不确定的环境中做出正确的决策,因此研究学习不可预测的对手阵型策略跑位是迫切需要的。本文在RoboCup仿真2D项目程序设计中提出利用神经网络权值直接确定法在线学习对手阵型策略,并设计学习对手阵型策略的神经网络模型,最后利用在线教练实时训练神经网络的模型。实验结果建立学习对手阵型的神经网络模型,并把训练好的模型加入防守策略中,有效提高了智能体的防守能力,增强了球队的整体技能。