SlurmX:基于Slurm使用面向对象设计方法重构的任务调度系统

作者:温瑞林; 樊春; 马银萍; 王政丹; 向广宇; 付振新
来源:计算机工程与科学, 2022, 44(09): 1532-1541.
DOI:10.3969/j.issn.1007-130X.2022.09.002

摘要

目前使用较为广泛的Slurm任务调度系统存在代码臃肿、新功能开发效率低和难以维护的问题,在参考目前较为成熟的任务调度系统(如Slurm和HTCondor)的优缺点的基础上,设计了一个性能优异、可扩展性好和维护方便的高性能任务及资源调度系统SlurmX。讨论了通过使用面向对象的手段,对Slurm内部的组件从上至下进行了功能级别的重新抽象和组织,并从系统架构设计和组件内部设计等方面,简述了该调度系统如何在保障性能的情况下,提供高可扩展性和内部模块之间的低耦合性。

全文