摘要

原始大数据具有高维和随机杂乱性特征,通过将大量数据分类,从中提取有价值的、潜在的信息难度较大,因此其挖掘的精度始终无法得以保证。提出基于朴素贝叶斯的大数据模糊随机挖掘方法。采用信息熵完成一次数据信息筛选,剔除无用的数据信息属性,结合信息熵和主成分分析法提出E-PCA算法,对大数据的降维处理。通过拉普拉斯消除朴素贝叶斯中条件概率为0导致的负面影响,结合关联规则和属性加权优化朴素贝叶斯,完成大数据模糊随机挖掘。实验结果表明,所提方法准确率始终保持在95%以上,完成大数据挖掘的耗时更短,且大数据的随机分类更准确,说明朴素贝叶斯的应用效果更好。