摘要

传统医学智能问答系统多采用基于问答数据库的问题相似度匹配方式实现,该方法效率低,并且需要很高的标注成本才能建立训练数据集。针对这些问题,设计基于自注意力机制的双向编码表示(BERT)的自动答案生成医学智能问答模型。采用BERT预训练模型输出作为语义嵌入,并结合注意力机制传递到下游自然语言翻译模型中,联结成BERT问答模型。在英文医疗问答数据集MedQuAD和中文医疗问答数据集cMedQA2两个开源数据集进行训练和测试,BLEU值分别达到了42.25和44.60,相比其他模型均有明显提高,可以将该模型用于实际问题中。