基于多头注意力机制的医学文本实体研究

沈同平; 俞磊; 束建华; 方芳; 王元茂

doi:10.13757/j.cnki.cn34-1328/n.2023.01.015

摘要

医学文本实体识别过程存在多义性和复杂性等特点，这导致传统的语言处理模型无法有效获取医学文本语义信息，从而影响了医学实体识别效果。本文提出了一种基于全词MASK的医学文本实体识别模型，其能有效处理中文文本。其中，BERT预处理层能够生成表征上下文语义信息的词向量，Bi-LSTM层对输入的词向量进行双向特征信息提取，注意力机制层对输出的特征向量进行权重分配，从而有效获取文本语句中的长距离依赖，最后通过CRF解码以生成实体标签序列。实验结果表明，该模型在中文简历语料库和CCKS2017语料库中表现优异，F1值分别为96.14%和92.68%。

出版日期2023
单位安徽中医药大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-18 10:19

基于多头注意力机制的医学文本实体研究

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友