摘要

针对经典语音增强网络在低信噪比环境下语音有丢失、可懂度低且代价函数与评价指标不匹配的问题,提出了一种改进多级混合注意力跳变连接Skip-DNN的语音增强算法。在网络输入层,融合多个互补域的特征,提升模型的泛化能力;在网络中间层,利用全局注意力模块和自注意力模块的多级跳跃连接结构嵌套跨级连接,融合每个网络块提取的重要特征信息,减少特征融合带来的冗余;提出了相关系数联合优化的代价函数,改善指标相关性。实验结果表明,所提方法在语音质量和可懂度上均有显著提升,分别平均提高了0.31和0.05,尤其在低信噪比环境下,具有更好的泛化能力。

全文