基于场景表示中对象特征语法分析的视频描述

付燕; 王**<sup>*</sup>; 叶鸥

doi:10.16208/j.issn1000-7024.2023.02.023

摘要

为解决基于编码器-解码器的视频描述方法中存在忽略特征语法分析，造成描述语句语法结构不清晰的问题，提出一种基于场景表示中对象特征语法分析的视频描述方法。编码阶段将视频的2D、C3D特征、对象特征和自注意力机制相结合，构建视觉场景表示模型，描述视觉特征间的依赖关系；构建视觉对象特征语法分析模型，分析对象特征在描述语句中的语法成分；解码阶段结合语法分析结果和LSTM网络模型，输出视频描述语句。所提方法在MSVD和MSR-VTT数据集进行实验，结果表明，该方法在不同评价指标方面性能较好，视频描述语句的语法结构清晰。

出版日期2023
单位西安科技大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 04:27

基于场景表示中对象特征语法分析的视频描述

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友