摘要
本发明公开了一种语音关键词识别中扩增语料的选取方法,步骤包括:对含关键词的原始语音进行语音转化,得到同一语义但不同说话人信息的语音;对原始语音进行语音端点检测去除静音部分,再获取原始语音和生成语音中的关键词片段;将原始语音关键词片段分为男女两类样本,分别训练UBMM、UBMF,用第i个关键词的男女两类原始语音关键词片段分别训练GMM(M,i)、GMM(F,i);采用GMM分离度度量判断GMM分量距离,将分离度较小的设为相似GMM分量,去除GMM(M,i)、GMM(F,i)中相似GMM分量,剩下分离度较大分量形成新的GMM′(M,i)、GMM′(F,i),用GMM′(b,i)、GMM′(g,i)对生成语音关键词片段进行性别分类;采用改进后的评价系数对生成语音进行评价,选取训练样本。本发明能在存在样本较少或不均衡的情况下更高效地训练模型。
- 单位