摘要

为了降低自动语音识别中深度学习的训练成本,提出了一种有效的基于梯度的主动学习询问策略。主动学习是通过一定算法查询出最"有用"的数据,并交给专家标记这些子集的过程,其关键是如何正确选择出"有价值"的样本集。根据预备实验结果,在理想状态下,真实的梯度长度可以最大程度地衡量样本信息量,提出了同时使用不确定性策略和期望梯度长度策略在神经网络中去逼近真实梯度长度的算法。验证结果表明,当应用于基于音素的语音识别系统时,提出的混合策略性能优于传统单一的主动学习查询方法,在噪声和安静环境中都获得了更快的收敛速度和更多的损失抑制。

  • 出版日期2021
  • 单位上海航天电子技术研究所