摘要

当前海量数据挖掘过程中特征数据无法精准选择、特征数据分类效率等问题显著,导致数据挖掘误差大,为此提出改进的支持向量机特征数据挖掘方法.首先明确支持向量机选择和约简特征空间的原理;其次构建模糊支持向量机算法,基于样本不平衡特征与样本重要程度确定差异性权值,使用遗传算法确定最优的支持向量机惩罚参数与核参数;最终将特征挖掘结果传递至数据挖掘算法作为分类输入样本,实现海量应用数据的智能挖掘.测试结果表明:遗传算法进化到15次开始收敛至最优解,可减少支持向量机挖掘特征数据的时间开销;该方法挖掘数据的平均F-measure值最高,在特征数据挖掘方面具有优越性.

  • 出版日期2022
  • 单位滁州城市职业学院