摘要

[目的/意义]探索和揭示期刊论文主题的三要素:题名、关键词、摘要的差异性。[方法/过程]在定义差异度的基础上,采用实验研究与数据分析方法,用字符匹配算法、杰卡德相似度算法和余弦相似度算法分别计算期刊论文的题名、关键词、摘要三者之间两两比较的差异度,分析三种算法的结果及其分布特征。[结果/结论]研究表明,题名、关键词、摘要在揭示期刊论文主题上存在一定的差异性,题名与摘要的差异度、关键词与摘要的差异度、关键词与题名的差异度三者的几何平均值可以表征这种差异性,余弦相似度算法计算的差异度大致呈现正态分布,但存在部分论文的关键词全部来自题名或题名与关键词完全不符的情况,不同期刊在不同年度的差异度分布无显著差别。