摘要

[目的/意义]定量研究英文期刊论文中标题和关键词在信息表达方面的差异性,对于文献准确标引、知识链接及数据库组织方式的优化具有指导意义。[方法/过程]定义了一种文本与关键词数组的差异度计算方法,以包含十余年期刊论文的一期ESI数据为研究对象,从信息量、整体差异度、差异度变化趋势、被引相关情况、学科差异等方面进行了研究。[结果/结论]结果表明,近十年ESI论文的标题及关键词中蕴含的信息均略有增加,两者之间的差异度有逐年减小的趋势;论文的标题和关键词二者间存在明显的信息表达差异性,差异度分布呈现中间及尾部多的状态;即使关键词-标题差异度较大,也会得到较大比例的关注(被引),但是这个趋势正在逐渐改变,高差异度论文受到的关注优势正在减少;不同学科的差异度分布情况有明显差异,但各个学科中标题均无法取代关键词成为论文被索引的唯一参考标准。