电力设备典型故障案例的文本挖掘

作者:杜修明; 秦佳峰; 郭诗瑶; 闫丹凤
来源:高电压技术, 2018, 44(04): 1078-1084.
DOI:10.13336/j.1003-6520.hve.20180329005

摘要

国家电网公司信息化工作中积累的大量典型故障案例多为描述性文本数据,很难利用自动化手段理解和分析。针对此一问题利用文本挖掘技术从故障案例中抽取故障问题和原因形成故障的因果关系,从而为故障文本的下一步挖掘提供必要条件。挖掘采用的方法是先将因果关系的抽取问题转化为对句子的3分类问题,缩小了目标集,提高了准确率;再将句子用分布式文本表示,利用双向长短期记忆网络(Bi LSTM),分类模型提取事件句的深层语义特征。变压器故障案例的实验结果表明Bi LSTM相比于单向LSTM、卷积神经网络(CNN)处理故障文本句子分类效果更优,对故障和原因信息的提取准确率更高,精确率和召回率的平均调和值达67%。

  • 出版日期2018
  • 单位国网山东省电力公司电力科学研究院; 北京邮电大学

全文