摘要

提出一种用于计算WordNet中概念信息内容(IC)值的模型。引入熵的概念,不仅考虑概念的子节点数目和概念所处分类树中的深度,而且考虑了概念子节点的空间结构,使得概念的IC值更为精确。将该模型代入到基于IC的语义相似度算法中,实验结果表明,该模型可有效提高算法的准确度。