摘要

针对目前高精度语义分割模型需要大量计算资源,难以在硬件存储和计算力有限的嵌入式平台上部署,提出了一种基于特征融合和注意力机制的图像语义分割模型。首先,对基于DeepLabV3+的模型进行优化,采用通道剪枝对MobileNetV2骨干网络轻量化;然后,在轻量化后的模型中引入拆分三重注意力模块(STA)来提高特征图内部维度相关性;最后,在解码部分增加细粒度上采样模块完善边缘细节信息。在PASCAL VOC 2012和Cityscapes数据集上的实验中,本文模型的参数量仅为4.15×106,浮点计算量为10.23 GFLOPs,平均交并比分别为70.98%和72.26%,表明该模型在计算资源、内存占用和准确性之间达到了较好的均衡。