面向电力审计领域的两阶段短文本分类方法研究

作者:赵雅欣; 郑明洪; 石林鑫; 向菲; 江金洋; 尹心
来源:西南大学学报(自然科学版), 2020, 42(10): 1-7.
DOI:10.13718/j.cnki.xdzk.2020.10.001

摘要

为解决电力审计领域中将审计发现问题按标准问题定义进行归类的现实需求,提出了一种两阶段短文本分类方法.该方法包括粗分类和细分类两个阶段.粗分类阶段通过对审计报告文本中的主观问题定性,对国网电力审计问题库文本中的审计问题的一级类目等粗粒度特征进行模糊匹配,实现审计发现问题预分类.细分类阶段通过对审计报告文本中的问题进行描述,对国网电力审计问题库文本中的审计问题的二、三级类目等细粒度属性进行文本特征抽取、特征向量化,并将粗分类阶段的结果用于文本特征和向量化的权值调整和相似性度量的对象范围选择,实现基于非结构化文本的审计问题分类.国网重庆市电力公司2016年审计发现问题汇总数据的实验结果表明,该方法能够有效提升审计问题分类性能,能为电力审计行业规范审计报告、提高审计效率提供有力支持.

  • 出版日期2020
  • 单位国网重庆市电力公司电力科学研究院