摘要

为了提高时序行为检测网络的分类精度和时序上的定位精度,本文提出了一种改进的区域3D卷积神经网络(Region Convolutional 3D Network,R-C3D)。在时序候选子网中,通过逐层空间卷积把特征图的高宽由(H/16,W/16)变为(1,1),提高行为的分类精度,通过卷积-反卷积网络(Convolutional-De-Convolutional Networks,CDC)里反卷积的思想,使用时域反卷积网络增加特征图长度,提高时域上行为的定位精度。在THUMOS14数据集的实验结果表明:与R-C3D相比,本文提出的方法在长时序未分割视频上有较高的检测精度。