摘要

本发明提供了一种基于语谱图时间差分的语音音节数估计方法,所述方法步骤包括:将语音信号的语谱图X,通过一个M阶图像后向平滑滤波器得到模糊形式语谱图X~*,对其进行N阶时间差分以及M阶图像后向平滑,计算出N阶差分图S;对N阶差分图的每一列进行频率区域选择性求和,以获得初步浊音起始边界统计特征,然后通过该特征以及边界时间间隔限制G-1得到初步浊音起始边界;使N阶差分图的低频部分与图案P进行局部图案匹配得到其图案特征图S~*,通过图案特征图计算出匹配浊音起始边界;结合初步浊音起始边界和匹配浊音起始边界,通过一个边界时间间隔限制G-2,得到最终的浊音起始边界,最后计算出音节数K。本发明具有可解释性,成本低,有着广阔的应用前景。