摘要

为克服半结构化数据存储复杂的缺点,提出一种基于动态树的半结构化的存储模型。对该模型进行模式抽取,并将其引入到Apriori算法。通过设置最小支持度阀值过滤掉不必要的信息,输出最长频繁路径的集合,以实现半结构化数据的提取。实验结果表明,该算法能同时有效地处理分支及环路问题,避免了死循环的出现。

  • 出版日期2012
  • 单位中国人民解放军空军航空大学; 吉林师范大学; 长春工程学院