摘要

针对科学合作网络姓名消歧问题,以文献题录信息和全文信息为基础,提出了基于语义指纹的综合特征文献著者姓名消歧方法,设计了指纹生成器、指纹比较器、认领决策器、作品指派器以及争议仲裁器。基于标题、作者、合著者、作者机构、期刊、日期、摘要、关键词、作者邮箱、全文等特征构建消歧实验测试数据集,将单特征测试中准确率较高而查全率较低的合著者特征、作者单位特征和查全率较高的文本指纹特征相结合,开展基于语义指纹的综合特征姓名消歧实验,并对实验结果进行评价。