基于因果门控注意力机制的多模态情感模型

李鸿基; 刘美华; 孙祥娥<sup>*</sup>; 胡林

摘要

多模态特征融合中使用跨模态注意力机制会出现混淆效应，导致模态交互时出现有害偏差，从而对情感分类结果产生影响。针对以上问题，提出一种基于因果门控注意力机制的跨模态融合网络。首先，利用特征掩膜文本嵌入模块提高音视频两个模态的语义表征能力，然后使用跨模态注意力融合模块将音视频模态互补融合，得到音视频模态融合特征，接着，使用因果门控跨模态融合网络充分融合文本和音视频模态异质数据，最后使用softmax对情感分析结果分类。提出的跨模态融合网络与基线方法相比，在CMU-MOSEI数据集上取得了不错的情感分类效果，故而能够有效的关联和集合多模态相关信息。

出版日期2023
单位长江大学

收藏分享被引浏览

更新时间：2024-01-10 10:11

基于因果门控注意力机制的多模态情感模型

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友