摘要

构建一种文本和朗读语音共同驱动的双模态语音与口型匹配控制模型,将文本与语音相结合,弥补单模式驱动中信息量不足的缺点,利用文本拼音提供正确的口型视位和朗读语音为口型视位提供正确的时序,实现对语音和口型动作过程的合理匹配。