摘要
为了解决噪声环境下语种识别准确率低的问题,提出一种将梅尔倒谱系数和伽马频率倒谱系数融合的语种识别方法。首先提取语音的梅尔倒谱系数和伽马频率倒谱系数,并依据语种识别中的贡献度对特征进行筛选;接着将特征映射在由梅尔域-伽马域组成的空间坐标系中,以得到梅尔伽马倒谱系数(MGCC);最后,将特征输入深度神经网络中进行语种识别。实验结果表明,所提方法的识别准确率和速度远高于使用单一声学特征及其他语种特征的方法。在纯净环境下,所提方法的语种识别准确率可以达到99.38%,在-5 dB低信噪比环境下也可达到89%以上。这充分证明了所提方法的有效性和鲁棒性。
- 出版日期2023
- 单位昆明理工大学; 自动化学院