摘要

大数据时代的病案信息呈爆炸式增长,数据成为医院最宝贵的资产。病案的利用与科研产出关系密切,病案利用度的高低直接决定临床科研水平。本文探讨了利用基于OCR文字识别、结构化和非结构化数据的存储、中文分词、全文检索、并行计算、大数据挖掘等技术的病案信息全文检索技术,实现图像格式的病案信息可识别化和可检索化,从而提高病案的利用率,充分发挥病案科研价值,提高病案信息对医院临床科研的支持力度,也为医院的管理决策提供强有力的数据支撑,使医院信息化管理水平能适应"大数据时代"发展要求。