一种语音关键词识别中扩增语料的选取方法

贺前华; 汪星; 严海康

摘要

本发明公开了一种语音关键词识别中扩增语料的选取方法,步骤包括：对含关键词的原始语音进行语音转化,得到同一语义但不同说话人信息的语音；对原始语音进行语音端点检测去除静音部分,再获取原始语音和生成语音中的关键词片段；将原始语音关键词片段分为男女两类样本,分别训练UBM-M、UBM-F,用第i个关键词的男女两类原始语音关键词片段分别训练GMM-((M,i))、GMM-((F,i))；采用GMM分离度度量判断GMM分量距离,将分离度较小的设为相似GMM分量,去除GMM-((M,i))、GMM-((F,i))中相似GMM分量,剩下分离度较大分量形成新的GMM′-((M,i))、GMM′-((F,i)),用GMM′-((b,i))、GMM′-((g,i))对生成语音关键词片段进行性别分类；采用改进后的评价系数对生成语音进行评价,选取训练样本。本发明能在存在样本较少或不均衡的情况下更高效地训练模型。

单位
华南理工大学

收藏分享被引浏览

更新时间：2025-03-28 03:08

一种语音关键词识别中扩增语料的选取方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友