摘要

针对传统残差网络对人脸表情特征提取存在的泛化能力差、识别准确度低等问题,本文实现了基于混合注意力机制和残差网络相结合的方法,从而能够更准确快速的实现对人脸表情进行识别。提出使用CABasicBlock代替ResNet34中的basic block作为骨干网络,并加入空间、通道注意力机制来提取人脸的全局面部特征,以及与表情重要关联的局部面部特征,使得网络收敛更快。在网络的残差模块后加入批量归一化和PReLU激活函数,以及在全连接层前加入了Dropout、全局平均池化,能有效预防训练过程发生过拟合,提升其泛化能力;引入Focal Loss函数平衡训练数据样本均衡性的问题,使用余弦退火策略对训练过程中的学习率进行动态衰减,从而减少训练时间。通过实验结果数据表明,在FER-2013测试数据集上的准确率为73.7%,说明此模型拥有更好的效果。最后,基于以上方法再结合OpenCV和PyQt5,构建了一个实时表情识别的可视化检测结果输出。