改进PrefixSpan的行为轨迹数据挖掘算法

陈万志; 赵帅; 方圆; 王天元

摘要

针对用户行为轨迹数据挖掘PrefixSpan算法构造投影数据库过程中重复扫描而造成时空开销过大的问题，提出一种改进的序列模式挖掘算法TDM-PrefixSpan(trajectory data mining based on prefixSpan algorithm)。依据时间序列分布特征，采用具有轨迹数据预处理的SMM(statistical mobility model)算法，通过分段合并和自适应调整方法去除异常数据，解决轨迹数据存在大量pingpong效应的问题。采用频繁项集逆序挖掘序列模式，通过已挖掘序列模式集迭代去除冗余项集得到待挖掘序列模式集，缩短扫描候选数据库时间。数据集测试结果表明：SMM算法预处理后，原始数据库数据规模减小；通过对比可知，TDM-PrefixSpan算法能够有效降低时间复杂度，提升挖掘效率。

出版日期2023
单位辽宁工程技术大学; 国网辽宁省电力有限公司营口供电公司

收藏分享被引浏览

更新时间：2024-03-19 06:04

改进PrefixSpan的行为轨迹数据挖掘算法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友