摘要

针对网络中"疫情相关"数据流主题多样性衍生及交叉变化快,使舆情在线监测尤其是主题可信度分析和真伪监测对算法时空复杂度要求较高,传统线下全文本数据块的离线分析模型很难适用的问题,提出了一种基于集成分类器的在线异常/主题可信监测(online abnormal monitor,OAM)模型。首先按照时间窗口构建单元可信分类器;然后利用集成索引算法将单元可信分类器进行在线高效融合;最后以流查询的模式完成在线异常监测。在中国信息安全测评中心的社交文本数据集上进行的对比实验结果表明,在加载相同分类器的情况下,OAM算法与其他亚线性算法相比,预测时间最多可减少19%。