摘要

本发明公开了一种基于键值匹配关系的视觉富文档信息抽取方法,包括:采集视觉富文档,对所述视觉富文档进行第一多模态特征提取,获得不同级别的特征文本;基于所述特征文本和词嵌入模型获得实体分类结果。本发明创新性地利用实体关联性来研究视觉富文档信息抽取,有效避开了基于命名实体识别的方法难以处理数字类别歧义性和语义歧义性等问题,对现有的视觉富文档信息抽取方法进行有效地补充。