摘要

文章以中国生物医学文献数据(CBM)中具有深度标引的分类号及共现的关键词作为统计对象,构建共现矩阵统计三级分类号与关键词的共现频率,在此基础上使用相互包容法计算分类号与关键词共现的紧密度,并以最高紧密度值作为判定关键词所对应的分类号。研究结果表明,该方法有效地将关键词划分到相应的分类号中,准确率达到88.89%,表明这是一种可靠的方法。同时,本文还对四级分类号与关键词的对应关系进行统计分析,结果发现随着分类号的细分,对应关键词的数量减少,显示出一定的层级特性。

全文