摘要

相对于文字语料库,多模态语料库能更完整地保留真实口译场景的语音与视觉信息,能更客观地反映口译操作的真实过程。本文分析了国内外多模态语料库的建设与研究现状,重点阐述了多模态口译语料库相关的建库技术,包括语料的有效采集及质量要求、多模态语料的切分及转写、多层次标注模型(包括副语言现象以及手势表情等非语言因素的标注)、围绕时间轴的对齐、标注的可靠性评估等,并展望了多模态口译语料库的应用前景。

全文