摘要

针对大事记数据的特点,以及各行业对于大事记的信息化需求,本文尝试提出一种利用知识图谱来整理大事记中的信息的方法,从而有效抽取领域年鉴大事记中的多元主体,厘清主体间复杂关系,并用于查阅及宣传工作。首先,根据大事记中各类事件的特点,进行事件分类和概念建模,从整体的角度,对大事记的信息化处理方案进行设计;其次,对知识图谱进行顶层设计,选取通用信息抽取模型进行信息抽取、知识图谱构建与存储的工作;最后,以《中国林业年鉴》的林业大事记部分为例,说明知识图谱的构建过程和应用。本文提出的知识图谱的构建过程和方法能够通过少量人工标注数据将大事记转化为结构化的知识库形式,便于高效便捷地检索大事记记录的事件信息,为挖掘大事记档案文本的价值提供了基础。

全文