摘要

由于文本信息比较复杂,字体大小不一,具有的像素信息较少,导致在特征提取阶段得到的特征图表达不充分,文本检测的准确率不高。针对以上问题,提出一种改进的Faster-RCNN文本检测方法。首先构建特征提取模块,用ResNet-101代替传统的VGG16网络提取图像特征;再融合特征金字塔的多尺度文本特征提取网络,在此基础上加入特征金字塔注意力模块;最后输入RPN层进行分类与边框回归。实验结果表明,改进后的Faster-RCNN比仅仅加入特征融合或特征金字塔注意力模块对文本检测效果提升明显。