摘要

细粒度图像分类指对大类下的子类进行识别,其实质是挖掘图像中微妙而有区别的特征.三线性注意力抽样网络是一个以注意力机制为基础的细粒度图像分类模型,虽然对图像特征提取及分类性能得以提升,但模型的鲁棒性和泛化能力没有得到体现.在三线性注意力抽样网络基础上注入dropout和随机深度给模型添加噪声,并用数据增强对图像数据做预处理,以提高模型的泛化能力和鲁棒性.实验结果表明,相较于与3种主流的细粒度分类算法,改进后细粒度图像分类的准确率明显提升.