摘要

建立双机协同被动探测的任务模型,运用模糊理论对问题状态空间进行泛化,针对不同的探测阶段给出了目标转移函数的不同形式,通过合理定义动作空间和奖励函数将问题描述为Markov决策过程。给出了双机协同被动雷达探测的模糊Q学习算法,并对算法进行仿真,仿真结果表明,该方法能够有效控制双机的飞行路径,实现对机动及非机动目标的有效探测。