摘要

卷积神经网络中常用的降采样在增大感受野的同时,减小了特征图的空间分辨率,导致大尺度文本在网络高层特征图中边界模糊,小尺度文本直接丢失。针对这种情况,设计一个主干网络,使其高层特征图具有较高的空间分辨率,用以提高模型对大尺度文本的定位能力和小尺度文本的分类能力,减少对背景误检的情况,从而提高检测的召回率和准确率。实验结果表明,采用该主干网络可以有效提升模型对多尺度文本的检测能力,F值在ICDAR2015数据集上达到81.89%。