摘要

历史文献数据库可区分为数字化、数据化、文本挖掘三种不同形态,迄今多数中文历史文献数据库实现了数字化功能,部分地实现数据化功能,而能够实现文本挖掘功能的则十分少见。数字化是将文献的物理形态转化为电子形态,数据化是将文献转化为可量化分析的数据,编制元数据是主要方法。文本发掘是在此基础上开发文本分析工具。《中国地方历史文献数据库》以文献学研究为基础,建立特定的元数据结构,提供交叉导航、数据统计等多种功能,这些功能不仅可以帮助研究者找到自己的所需文献,更可能帮助研究者发现新的研究议题。史学研究中,数据库有必要被视作一种新的文献形态,建立针对性的文献学方法论。