摘要

本发明公开了一种基于深度双Q学习的移动边缘计算系统能源分配方法,包括以下步骤:将移动边缘计算系统的能源分配过程转化为马尔可夫决策过程,所述马尔可夫决策过程包括系统状态s、系统动作a、动作值函数Q(s,a)三个要素;通过基于深度双Q学习的能源分配算法,预测动作值函数的精确值,选择最大动作值函数所对应的动作,得到最优能源分配策略,完成移动边缘计算系统的能源分配。本发明将深度双Q学习(DDQN)应用于移动边缘计算系统的能源分配,通过深度双Q学习(DDQN)算法求解最优能源分配,实现边缘计算系统服务器的长期可持续计算的效益最大化。