摘要

针对热点问题跨越时间长以及含重复情报、过时情报和无实用价值信息量大等问题,提出了一种新的热点问题情报获取模型与分级过滤算法,以解决情报的去粗取精、去伪存真问题.首先将无序关联情报结构化,然后采用SVM(space vector model)方法,根据热点问题情报的特殊性,提出了新的特征选择方法,在特征向量的相似性计算中引入去除重复和过时情报的判别参数,达到优化情报的目的.实验结果表明,过滤算法除去原始情报库中的无关情报、重复情报和过时情报后剩余情报数约为原始情报数的59%.