基于知识图谱的羊群疾病问答系统的构建与实现

作者:杨喆; 许甜; 靳哲; 孔玫; 李国亮; 杜小勇*
来源:华中农业大学学报, 2023, 42(03): 63-70.
DOI:10.13300/j.cnki.hnlkxb.2023.03.008

摘要

为解决羊群疾病检索过程中出现的大量冗余数据及检索后仍需人工挑选准确答案造成的资源浪费,本研究通过以下3个步骤构建基于知识图谱的羊群疾病问答系统:(1)通过爬虫获取数据,人工提取部分信息,再进行自动化信息抽取,在命名实体识别任务中使用双向长短期记忆循环神经网络Bi-LSTM模型,并添加注意力机制提高识别效率,然后使用BIO规则进行实体标注,完成信息抽取,将数据融合后存储在Neo4j图数据库中,构建羊群疾病知识图谱。(2)针对属性映射,构建Bert-softmax模型;根据用户提问,采用Bert模型计算问句和属性的语义相似度,并通过softmax算法进行归一化处理,返回合适答案给用户,实现羊群疾病问答系统算法设计。(3)构建羊群疾病诊断平台,使用Bootstrap、Echarts、Vue组件实现羊群疾病问答系统的可视化,利用Python语言包含的flask框架搭建后台,封装疾病信息,通过web前端呈现给用户,并于后端建立连接,实现数据之间的交互。试验结果显示,基于Bi-LSTM+Attention+CRF模型实体识别的F1值为83.16%,构建的知识图谱包含实体4 576个,实体关系超13 000条;问答系统添加了预训练模型Bert,对问题识别的F1值为85.24%。结果表明,该系统实现了对羊群疾病的防治措施等多类问题进行快速检索和精准回答,可以辅助养殖人员在面临羊群疾病时进行生产决策。

全文