摘要

伴随着人工智能的兴起,各种深度学习模型应运而生,生成式对抗网络(generative adversarial networks,GAN)作为其中的一种深度学习模型成为了研究热点。GAN已成功应用在图像处理中,但将其应用在语音增强方面是需要研究的问题。GAN应用在语音增强的研究方法与GAN的实质是一样的,是通过构造两个模型,即生成模型(generative model)和判别模型(discriminative model),也叫做生成器(generator)和判别器(discriminator)。两者通过互相竞争、对抗的形式来学习训练,GAN最终要实现的目标是生成新的数据,即实现去噪。对GAN在语音增强方面的应用进行了研究,提出了使用传统的GAN数学模型用于语音增强进行建模,同时改进了GAN的数学模型并加入了稀疏因式,将GAN增强后的语音与其他传统的语音增强方法进行对比。实验结果表明,使用GAN增强后的语音的segSNR和PESQ的得分要比传统的语音增强方法的得分高,从而证明GAN比其他传统的语音增强方法更具优越性。