基于约束式双通道模型的语音情感识别

孙颖; 李泽; 张雪英

摘要

针对语音情感识别过程中特征不充分的问题，提出了约束式双通道模型，从全局和局部两方面充分挖掘特征所包含的情感信息，从而提高情感识别率.通道1是针对语音特征的全局信息，通过改进门控循环单元，构建了BAGRU(bidirectional attention gate recurrent unit)模型，提高了语音特征之间的相关性；通道2是针对语音特征的局部信息，卷积神经网络与对抗训练结合，避免了局部信息相互干扰.通过双通道融合模型，根据通道特征重要程度生成不同权重，同时引入正交约束，解决了融合时产生特征冗余的问题.研究结果表明，在IEMOCAP和EMO-DB情感语料库上分别达到了62.83%和82.19%的识别精度，表现出了良好性能.

出版日期2023
单位太原理工大学

收藏分享被引浏览

更新时间：2024-03-19 06:42

基于约束式双通道模型的语音情感识别

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友