改进DBNet的电商图像文字检测算法研究

李卓璇; 周亚同

摘要

电商图像背景较为复杂、文字区域形状多变，现有的文字检测模型无法精确检测文字位置这一问题。提出一种改进的文字检测模型——迭代自选择特征融合DBNet(iSFF-DBNet)。首先在主干网络提取特征后，在构建特征金字塔网络FPN的过程中引入注意力机制；然后提出了迭代自选择特征融合模块iSFF来提升模型的特征提取能力；最后引入双边上采样模块提升可微分二值化模块的自适应性能。实验结果表明，在ICPR MTWI 2018网络图像数据集文本检测任务中，对比标准的DBNet模型，所提改进模型的召回率和F-score分别提升了6.0%和2.4%。与其他文字检测模型相比，该模型在精确率和召回率上取得了平衡，能够更准确地检测文字。

出版日期2023
单位河北工业大学; 电子信息工程学院

收藏分享被引浏览

更新时间：2024-03-19 04:43

改进DBNet的电商图像文字检测算法研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友