摘要

为提高智能家居语音验证系统中重放语音检测精度,提出了一种新型的单词级语音活体检测方法,即采用轻量型卷积全局门控循环神经网络(light convolutional global gate recurrent neural network,LC-GGRNN)作为深度特征提取器,由支持向量机执行真实和重放语音分类。特别地,LC-GGRNN是在轻量型卷积神经网络的基础上引入了全局注意力机制和门控循环单元,前者是为关注提取特征的通道信息、空间信息以及通道与空间相互作用的信息,后者是为学习深度特征的长期相关性。提取POCO(pop noise corpus)数据集中音频文件的3种声学特征分别用于模型训练、验证和测试。结果表明,提取的伽马通频率倒谱系数声学特征在所提方法上检测效果最好,准确率、等错误率分别为85.72%、14.28%,错误接受率和错误拒绝率之和为28.59%,还可以证明所提方法在POCO上的语音活体检测具有性别依赖性。此外,所提方法对句子级重放语音检测也具有较好的泛化性。