摘要

针对X光图像违禁品检测中的复杂背景、正负类别不平衡和漏检等问题,提出一种基于YOLOv5的X光违禁品检测算法。该算法通过在YOLOv5s骨干网络中引入Swin Transformer模块,利用局部自注意力与Shifted Window机制提升模型对X光图像全局特征的提取能力,并且在主干网络后增加空间注意力机制与通道注意力机制,以提升算法对违禁品关键特征的提取能力。引入一种自适应空间特征融合结构,缓解特征金字塔中不同层级特征图之间冲突对模型梯度的干扰。引入Focal Loss函数用于改进YOLOv5s的背景预测损失函数和分类损失函数,提升算法在正负样本与难易样本失衡情况下的检测能力。该算法在公开数据集SIXray100上的平均检测精度达到57.4%,相比YOLOv5s提高了4.5个百分点;在SIXray正样本数据集上的平均检测精度达到90.4%,相比YOLOv5s提高了2.4个百分点。实验结果表明,改进后的算法相比原始YOLOv5s算法检测精度有较大提升,证明了算法的有效性。

  • 出版日期2023