一种分布式图处理系统中加速无检查点故障恢复的方法

作者:徐辰; 杨溢; 杨振华; 潘青峰; 钱卫宁; 周傲英
来源:2022-01-12, 中国, CN202210031284.5.

摘要

本发明公开了一种分布式图处理系统中加速无检查点故障恢复的方法,包括感知分区的备份策略以及增量协议。若所述故障涉及无拓扑突变的图算法,则应用感知分区的备份策略;若所述故障涉及拓扑突变的图算法,则感知分区的备份策略及增量协议协同使用。感知分区的备份策略在正常执行期间将系统中各个节点的子图进行备份,并在恢复期间直接通过备份恢复故障节点上的丢失子图,从而减少了无检查点的恢复方式在恢复期间引入的附加开销。增量协议在正常期间将涉及拓扑突变的信息作为日志记录下来,并在恢复期间利用这些日志将系统中所有节点的拓扑恢复至故障发生前的某个时刻,避免了无检查点的恢复方式在处理涉及拓扑突变的故障时导致结果不精确的问题。