一种垂类领域端到端语音识别方法与装置

作者:余兰林; 莫远秋; 余涛; 熊军林; 都海波; 李晨
来源:2023-02-28, 中国, CN202310201243.0.

摘要

本发明提供了一种垂类领域端到端语音识别方法与装置,涉及智能语音技术领域,包括如下步骤:接收待识别语音信号,提取待识别语音信号的声学特征;将声学特征输入训练好的端到端语音识别模型中获取识别结果;通过编码器提取语音信号的高级声学表征,并通过与上下文感知矩阵融合得到上下文声学表征;通过上下文编码器将上下文短语映射成固定维度的字嵌入表征;通过编码器结合解码器提取音频对应文本的最终词嵌入表征并与所述上下文声学表征通过注意力机制进行融合,输出解码结果。本发明考虑上下文编码器同时考虑了上下文短语的字序列及发音序列,有利于提取更加具有区分性的词嵌入表征,缓解上下文短语量级的提升而导致的相似短语之间的串扰。