摘要

本文基于Spark作为大数据处理的引擎核心和编程模型,通过研究大量的开源解决方案,建立模型并改进求解,接着引入逃脱因子来对模型进行优化,最后运用Spark的内存计算模型及其提供的若干个动作、转换,完成了大数据背景下传统Page Rank算法的并行优化研究。结果表明运用该算法有够较快的执行速度和较好的集群性能。

  • 出版日期2018
  • 单位成都师范学院