摘要

针对在相似目标检测问题中,以YOLOv5为代表的一步法漏检错检率高、以Faster R-CNN为代表的两步法检测速度慢的问题,提出了一种改进的YOLOv5-ResNet相似目标检测网络模型。该模型以YOLOv5框架为基础,借鉴了两步法的优点。在边框生成方面,改进了特征融合结构,强化了模型的特征提取能力,降低了总体漏检、误检率。在类别预测方面,引入SE(squeeze and excitation)模块,在通道方向上施加注意力机制,降低网络检测时的计算量,并保持了较高的准确率。在斯坦福宠物狗数据集和自制音符卡片数据集上的实验结果表明,本文提出的相似目标快速检测模型不仅在识别精度方面略高于Faster R-CNN,而在速度方面仅次于YOLOv5,检测帧率约为YOLOv5的72%,能够满足相似目标检测的实时需要。