摘要

在一段未修剪的视频中检测动作是一项重要且具有挑战性的任务,因为现实生活中的视频内容丰富,对于长时间、背景复杂的真实视频分析是必不可少的。目前行为识别算法已经达到了较高的精度,但是时序行为定位算法精度仍待提高,BSN(Boundary-Sensitive Network)算法采用从边界到全局的思想进行行为定位,具有较高的准确度。针对原算法中网络结构较简单导致不能够学习到较多的原始视频特征,论文通过在时序评估模块构建低级双流特征,将时间和空间特征信息相融合,保留了原始视频丰富的语义信息,使得时序概率建模更加精准;利用Softer-NMS算法在非极大值抑制时对生成的序列进行坐标修正。在数据集THUMOS-14上的实验结果表明,相对于现有的算法,论文算法有效地提高了时序动作区域的定位精度。