基于数字指纹的文献相似度检测研究

白如江; 王晓笛; 王效岳

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于数字指纹的文献相似度检测研究

作者：白如江; 王晓笛; 王效岳

来源：图书情报工作, 2013, (15): 88-95.

摘要

针对中文文献抄袭检测提出了一种基于汉语词频的文本数字指纹,通过对具有参考性的语料库进行词频和字频统计形成一个hash词表,然后基于最大熵原理为任意长度的文本生成一个基于词频特征的文本数字指纹,对于任意两篇文献可以通过计算对应的两个数字指纹的Hamming距离来得到一个相似度的估计。通过使用维基百科zhwiki-20121129-all-titles语料库构建hash词表,对情报学领域4种核心期刊进行实验,结果表明这种数字指纹对常见的抄袭情况都能很好地识别和检测,具有很强的鲁棒性。

出版日期2013
单位山东理工大学

收藏分享被引浏览

更新时间：2019-07-18 06:10

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号