摘要

现阶段,图像深度学习算法无法检测时序性的工艺流程问题。本文针对针织机械山板总成的人为装配工艺进行研究,提出MS-RetinaNet目标检测算法。借鉴自然语言处理的思想,引入Swin-Transformer结构,保留了CNN结构的层次性,弥补了CNN结构对于高层语义信息融合不足的问题,增强了全局与细节学习能力;使用改进的GIoU Loss,增加判定因子式,缓解损失计算退化的影响,优化边界框回归效果;根据多尺度目标参数,采用最佳锚框比,提高了召回率和检测精度;设计时序检测头,使算法具有判别目标先后顺序和逻辑关系的能力。实验结果表明,算法AP可达90.3%,高于当前主流算法2%以上,单张图片检测速度约46 ms,满足了工艺流程的时序检测要求,综合性能优越。

全文