摘要

为解决传统数据挖掘方法中存在的挖掘时间较长,查准率较低等问题,提出了一种开放式网络非均匀采样数据准确挖掘方法。运用划分技术构建数据划分区域,估计各个划分区域的重要度,获取相对重要的显著性区域边界,在显著性区域内对数据进行随机采样。通过改进型的样本子集优化方法从采样后的数据中选择最具有参考价值的数据作为原型集,分析原型集与训练集样本间的差异性,根据其分析结果构建相应的特征空间。为实现映射到特征空间内的差异度数据集的非均匀采样数据挖掘,需要使用分类预算法进行学习。实验结论为,开放式网络非均匀采样数据准确挖掘方法能够有效解决传统方式中的问题,如减少数据挖掘时间,提高数据挖掘查准率等。

  • 出版日期2020