摘要

人脸特征点检测是人脸图像处理的关键步骤之一,目前常用的检测方法是基于深度神经网络的坐标回归方法,具有处理速度快的优点,但用于回归的高层次网络特征丧失了空间结构信息,缺乏细粒度表征能力,使得检测精度不高。针对该问题,提出一种基于多层次自注意力网络的人脸关键点检测算法。为了提取更具有细粒度表征能力的图像语义特征,提出一种基于自注意力机制的多层次特征融合模块,实现高层次高语义信息特征和低层次高空间信息特征的跨层次特征融合。在此基础上,提出了一种多任务学习人脸特征点检测定位与人脸姿态角估计的训练方式,优化网络对人脸整体朝向姿态的估计,以提升特征点检测的准确性。在人脸特征点主流数据集300W和WFLW上的实验结果表明,与SAAT、AnchorFace等对比方法相比,本文方法有效提升了网络的检测精度,标准平均误差指标分别为3.23%和4.55%,相较基线模型降低了0.37%和0.59%,在WFLW数据集上错误率指标为3.56%,相较基线模型降低了2.86%,能够提取更具鲁棒性和细粒度的表达特征。

全文