K-Canopy:一种面向话题发现的快速数据切分算法

陈强; 杜攀; 陈海强; 包秀国; 刘悦; 程学旗

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

K-Canopy:一种面向话题发现的快速数据切分算法

作者：陈强; 杜攀; 陈海强; 包秀国; 刘悦; 程学旗

来源：山东大学学报(理学版), 2016, 51(09): 106-112.

摘要

针对海量数据上的话题发现任务,提出了一种均匀快速的数据预切分算法。在保证一定精度情况下,通过该算法可以按照数据的语义关联强度快速有效地将数据集切分成大小均匀的子数据集,以支持后续的话题发现算法的并行执行。实验表明,所提出的方法能够快速切分海量数据,保持块内数据的语义关联,大大提升话题发现的效率与质量。

出版日期2016
单位中国科学院; 中国科学院计算技术研究所; 中国信息安全测评中心; 国家计算机网络与信息安全管理中心; 中国科学院大学

收藏分享被引浏览

更新时间：2024-05-12 22:05

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号