摘要

该文针对非线性数据集中线状模式的挖掘问题,提出一种基于密度权期望最大(EM)与分裂合并策略的回归算法。算法基于有限混合模型思想,使用点向式方程定义线状模式表示,将网格密度作为调节权值引入EM过程,有效降低了回归落入局部极值的可能性。同时,引入分裂合并策略,使得算法能够解决连通性问题,并且即使在挖掘数设置与本质线状模式数不相符时也能获得正确结果。实验结果表明,算法对挖掘数设置不敏感,能够正确挖掘出噪声环境下数据集的线状模式。