摘要

民国报纸数字化实践工作中,质检环节尤为重要,高质量的数据是后期提供优质服务的可靠保障。质检问题涉及报纸、版式和OCR文字识别三个方面。报纸层面存在记录标识号、报名、出版日期和版次等问题;版式层面涉及栏目范围、篇目置标和标题置标等问题;OCR文字识别的问题主要为多字、少字、符号和字形识别错误等。

  • 出版日期2017
  • 单位国家图书馆

全文