摘要

针对敏感信息检测中误报率高的问题,文中提出一种基于聚类的敏感信息检测结果优化方法。该方法首先对系统自动判断的敏感信息文档进行聚类分析,然后将代表性的文档交给专家,最后通过判断代表性文档的敏感性确定其所在聚类的所有文档的敏感性。实验结果显示优化之后敏感信息检测结果的误报率比优化之前有显著的降低,表明该方法对降低敏感信息检测的误报率是有效的。

  • 出版日期2016
  • 单位中国国防科技信息中心; 杭州世平信息科技有限公司