摘要

针对现有文本生成模型是基于通用领域且生成文本不可控的问题,提出一种基于BERT的知识图谱文本生成系统。该系统使用预训练模型BERT+BiLSTM+CRF进行信息抽取构建火力发电领域知识图谱,对输入的句子进行命名实体识别以及状态词识别,然后在图谱中进行属性映射,从抽取出的目标答案中依据相似度和实体识别数目进行加权排序,最终得到对输入句子的语义扩充。通过实验测试表明,使用专业数据标注对BERT+BILSTM+CRF模型训练后,命名实体识别在火电专业数据上准确率达到97.39%,该系统利用构建的知识图谱能够对输入的句子进行语义扩充,并且能够进行知识查询,可以更好地辅助撰写专业领域的相关文档。