开放集文字识别技术

杨春; 刘畅; 方治屿; 韩铮; 刘成林; 殷绪成<sup>*</sup>

摘要

开放环境下的模式识别与文字识别应用中，新数据、新模式和新类别不断涌现，要求算法具备应对新类别模式的能力。针对这一问题，研究者们开始聚焦开放集文字识别（open-set text recognition,OSTR）任务。该任务要求，算法在测试（推断）阶段，既能识别训练集见过的文字类别，还能够识别、拒识或发现训练集未见过的新文字。开放集文字识别逐步成为文字识别领域的研究热点之一。本文首先对开放集模式识别技术进行简要总结，然后重点介绍开放集文字识别的研究背景、任务定义、基本概念、研究重点和技术难点。同时，针对开放集文字识别三大问题（未知样本发现、新类别识别和上下文信息偏差），从方法的模型结构、特点优势和应用场景的角度对相关工作进行了综述。最后，对开放集文字识别技术的发展趋势和研究方向进行了分析展望。

出版日期2023
单位中国科学院自动化研究所; 北京科技大学

收藏分享被引浏览

更新时间：2024-03-18 10:28

开放集文字识别技术

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友