摘要

文本数据是电力大数据的重要组成部分,对其进行有效挖掘是智能电网深入、全面发展的需要。在目前已有研究成果的基础上,对电力领域文本数据挖掘的现状及挑战进行了深入剖析。首先分析了文本挖掘技术的发展过程及存在难题;接着重点分析了电力文本数据挖掘的关键技术及其研究现状,包括文本预处理技术、文本表示方法以及数据挖掘方法;然后以电力设备缺陷文本为对象,介绍了文本挖掘技术在电力领域的应用,包括缺陷文本质量的提升与保证、缺陷文本严重程度自动分类、缺陷发生部件及程度的自动提取、缺陷文本检索、基于缺陷文本的电力设备健康状态评价等,可为其他类型电力文本的挖掘提供参考;最后,探讨了电力文本挖掘面临的挑战以及未来发展方向。

全文