摘要

针对可见光单模态行人检测在夜间光线不足、目标密集、多尺度目标及目标部分遮挡场景中检测效果较低的问题,提出一种基于改进YOLOv3的多模态融合行人检测算法YOLOv3-Invo。该算法采用改进的Darknet-VI作为多模态特征提取网络模块,通过级联操作将两个不同特征图拼接输出,脖颈检测层分支引入空间金字塔池化模块并结合高效的内卷算子网络,以降低模型参数量;在检测网络层的深度卷积堆叠模块中设计新的ResFuse模型替换第一个卷积,并结合注意力机制CBAM模型,以加强融合特征图提取。对比实验表明,该算法在KAIST数据集上的行人检测准确率和召回率分别提升8.24%和2.82%,验证该算法的有效性,具有一定的研究价值。