摘要

[目的]旨在对互联网医疗健康平台用户生成的大量复杂信息内容实现语义发现与关系揭示。[方法]研究构建了基于改进Casrel实体关系抽取模型的在线健康信息语义发现模型,基于Casrel模型在文本编码层引入更适用于医疗健康领域的ERNIE-Health预训练模型,在实体与关系解码层中使用多级指针网络标注和神经网络融合主体特征进行关系及客体的解码。[结果]通过评估实验发现,相较于Casrel原模型而言,改进后的Casrel实体关系抽取模型对在线健康信息语义发现的实体识别和实体关系抽取任务中,F1值分别提高了7.62%和4.87%。[局限]模型的整体效果还需要在数据集的体量扩充、不同疾病类型的健康信息实证环节进行验证,以增强模型的通用性与普适性。[结论]通过三组对比实验验证了本研究提出的改进Casrel实体关系抽取模型对在线糖尿病健康信息语义发现任务的有效性。