改进深度信念网络在语音转换中的应用

王文浩; 张筱; 万永菁<sup>*</sup>

摘要

综合考虑语音帧间关系及后处理网络的效果,提出一种改进的基于深度信念网络(DBN)的语音转换方法.该方法利用线性预测分析-合成模型提取说话人线性预测谱的特征参数,构建基于区域融合谱特征参数的深度信念网络用以预训练模型,经过微调阶段后引入误差修正网络以实现细节谱特征的补偿.对比实验结果表明,随着训练语音帧数的增加,转换语音的谱失真呈下降趋势.同时,在训练语音帧数较少的情况下,改进方法在异性间转换的谱失真小于50%,在同性间转换的谱失真小于60%.实验结果表明,改进方法的谱失真度较传统方法降低约6.5%,且同性别间转换效果比异性间转换效果更为明显,转换后语音的自然度和可理解度明显提高.

出版日期2019
单位华东理工大学

收藏分享被引(5) 浏览

更新时间：2024-04-11 20:08

改进深度信念网络在语音转换中的应用

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友