基于DKU-JNU-EMA数据库发音特征的方言识别

作者:李海烽; 张雪英*; 段淑斐*; 贾海蓉; 李良琦
来源:复旦学报(自然科学版), 2023, 62(01): 37-45.
DOI:10.15943/j.cnki.fdxb-jns.20230208.004

摘要

为研究广东话、客家话、潮州话和普通话的发音差异性,提出了一种基于发音特征的方言识别系统。本研究采用DKU-JNU-EMA数据库,以广东话、客家话、潮州话和普通话为研究对象,通过端点检测法实现对数据集的预处理,提取了数据集中发音器官的位移、速度和加速度参数,并对发音运动器官进行了空间和速度的统计学分析,然后选用随机森林和支持向量机分类器对所取的提特征集进行识别分类。实验结果表明,本文提取的发音特征在机器学习分类器的识别分类中是有效的,选用支持向量机做分类器时,在齿龈位置的分类平均准确率达到83.1%。