摘要

数据融合是运用系统诸多方面数据,采集目标对象或者环境中信息进行数据综合处理,从而获取数据中隐藏有效信息。在云计算环境下,针对分散文本数据提出基于阈值优化聚类的神经网络数据集成融合改进方法。运用k-近邻距离对分散文本数据对象实行顺序排列,采用分位数求解阈值并区别不同文本数据密度各个子序列,寻找与子序列相对应的局部阈值,同时对数据子序列进行聚类处理,利用数据结构储存每个簇。采用自组织映射对聚类文本数据进行离散化处理,根据文本数据实际要求,选择揭示离散数据属性的粗糙集衡量指标,通过粗糙集数据分析获知分散文本数据决策属性,将数据输入神经网络中根据判别规则进行文本数据融合。实验证明,运用文中方法可有效抽取各分散文本数据中存在的有价值数据信息。

全文