摘要

现有的图挖掘算法在云环境下难以有效地进行大规模图形的高频模式挖掘。为此,对Spider Mine算法做了改进,提出一种基于云的Spider Mine算法(c-Spider Mine)。首先,利用最小切割算法将大规模图形数据分为多个子图,使分区/融合成本最小,然后,利用Spider Mine进行模式挖掘,显著降低了大型模式生成时的组合复杂度。最后,采用一种模式键函数来保存模式,以保证所有模式可被成功恢复和融合。基于3种真实数据集的仿真实验结果表明,c-Spider Mine可高效挖掘云环境下的前K个大型模式,在不同数据规模和最小支持设置条件下,c-Spider Mine在内存使用和运行时间方面的性能均优于Spider Mine。