摘要

视觉注意力模型被应用于自动定位细粒度图片的局部区域以捕捉图片中有辨识度的特征并进行图片的分类的任务,但是模型每次的输入图片尺寸是固定的而辨识度的特征区域大小是不确定的,因此模型不能够准确捕捉图片的全部特征造成分类准确率的下降。本文提出一种可变尺寸循环注意力模型,与之前的固定输入图片尺寸的循环注意力网络相比,模型通过优化注意力策略和尺寸生成策略,能够自主地学习下次输入图片的位置和尺寸,减少总输入图片面积,从而提高处理速度。实验结果表明,动态调整输入图片尺寸,在保持和视觉注意力模型相同的识别准确率的情况下,可以显著减少计算总量,提高速度。