摘要

提出了一种改进人工神经网络对病理嗓音共振峰修复的方法。分别提取正常语音和病理嗓音的线谱频率LSF(Line Spectral Frequencies),经过动态时间弯折后输入到改进BP神经网络训练。该网络通过自适应学习率和附加动量项来减少训练时间;将待修复病理嗓音通过训练好的网络进行映射,从而得到修复后的线谱频率;根据修复后线谱频率求解得到重构后的共振峰,实现对病理嗓音共振峰的修复。实验表明,该方法能对病理嗓音共振峰有效修复,修复后嗓音平均MOS得分比修复前提高55.8%。根据客观评价指标线谱对失真测度,该方法修复的语音线谱对失真测度比分段定值偏移与扩展型双线性变换联合法减少了23.4%,表明修复后的嗓音在可懂度和音质方面都有很大的提高,取得了好的修复效果。

  • 出版日期2019