基于Spark的大数据统计中等值连接问题的优化

刘容辰; 周明强; 皮兴杰; 赵欣

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于Spark的大数据统计中等值连接问题的优化

作者：刘容辰; 周明强; 皮兴杰; 赵欣

来源：现代计算机(专业版), 2017, (12): 3-6.

摘要

伴随着互联网应用技术的飞速发展,导致传统的数据处理技术已经无法满足对大数据高效处理的要求。因此对现有的大数据的统计分析便急需相应的大数据技术的支持。为了解决实际Spark应用中的Join操作低效的问题,首先,提出一种高效的基于BloomFilter过滤再分区算法,通过该算法率先过滤掉绝大部分不符合条件的无效连接,然后针对过滤数据产生的倾斜问题进行再分区操作,以便能充分发挥各个工作节点的计算资源,达到在最大程序上优化Join过程的目的。

出版日期2017
单位重庆大学

收藏分享被引浏览

更新时间：2021-08-11 21:12

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号