摘要

针对因高比例异常数据的特征种类较多且存在状态转移特性,导致识别误差大的问题,提出一种基于神经网络的高比例异常数据识别算法。根据相邻数据集间具有时间和空间相关性特点,建立数据基础状态映射序列,计算数据样本在不同空间、不同时间点上的初始状态和结束状态,以及上一时刻和当下一时刻的数据空间和时间所属状态,根据前后变化对比得到状态转移概率,计算提取数据在不同时间点的具体特征。采用神经网络建立高比例异常数据识别模型,对待识别样本标准化处理,定义标准样本并提取特征因子,求解样本集中所有数据与标准样本的隶属度,存在正向相关关系为正常样本,反向则为异常数据样本,通过阈值对比实现高比例异常数据的有效识别。实验结果表明,所提算法识别精准度较高,误差率较低,具有一定的实用价值。