摘要
随着制造模式往多品种、小批量的转变,车间生产过程变得复杂多变,传统的依赖于人工和静态式的调度方法已经无法适应实际的车间环境。为此,设计一种基于马尔可夫决策过程的柔性作业车间调度模型。以车间环境作为状态空间,以设备选择作为动作空间,以最小化完工时间作为调度目标,将柔性作业车间调度视为序列化决策问题,使用一种基于策略梯度下降的深度学习方法训练该模型,在仿真环境中对该算法进行验证。结果表明:本算法降低了总完工时间,均衡了机器负载,提高了生产效率和调度智能性。
- 出版日期2023
- 单位南京航空航天大学; 北京电子工程总体研究所