摘要

针对自然场景图像中多语言文本检测准确率低的问题,提出一种基于计算机的多语言文本区域快速检测方法。首先,根据自然场景中多语言文本文字排列多方向、文字形态多变化、文字大小不统一的特点,选用EAST快速文本检测模型作为多语言文本区域检测方法的基本模型,并分析了该模型结构;然后,为提高EAST模型检测效果,采用VGG16网络改进模型特征提取层,并对模型输出层进行改进设计;最后,通过融合MSER特征与改进EAST模型,并在ICDAR2015、KAIST、MSRA-TD500数据集上进行检测实验,验证了对提出方法的有效性。结果表明,本研究基于计算机的多语言文本区域快速检测方法可有效、准确检测定位自然场景图像中多语言文本区域,相较于EAST模型和改进EAST模型,本研究融合MSER特征与改进EAST模型的文本区域快速检测方法,综合性能提高了约0.02,具有更好的检测效果。

  • 出版日期2021
  • 单位四川科技职业学院