基于问题分解的多跳阅读理解方法

樊睿文; 白宇; 蔡东风

摘要

多跳阅读理解是自然语言处理研究领域的热点和难点，其研究在文本理解、自动问答、对话系统等方面具有重要意义和广泛应用。针对当前面向中文的多跳阅读理解（Multi-Hop Reading Comprehension,MHRC）研究不足的现状，构建了一个面向复杂问题的中文多跳阅读理解（Complex Chinese Machine Reading Comprehension,Complex CMRC）数据集，提出了一种基于问题分解的中文MHRC方法。该方法分为问题分解和问题求解两个阶段：首先提出了一种融合JointBERT模型和规则的复杂问题分解方法，通过JointBERT模型对问题类型识别和问题片段识别联合建模，获得准确的问题类型和问题片段信息，再利用专门设计的问题分解规则将复杂问题分解为多个简单子问题；然后采用BERT预训练模型对所有子问题进行迭代求解，最终获得复杂问题的答案。分别在Complex CMRC数据集上进行问题分解和问题求解实验，取得了良好的实验结果，验证了提出方法的有效性。

出版日期2023
单位沈阳航空航天大学

收藏分享被引浏览

更新时间：2024-03-18 11:59

基于问题分解的多跳阅读理解方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友