摘要

<正>一、Hadoop平台发展历史在信息飞速发展的时代,数据成指数增长,出现了许多用于数据存储和分析的分布式系统,但由于Hadoop能够实现一次写入多次读取的数据更新和支持PB级数据等优点,成为了广泛应用的分布式数据处理系统,如图1所示,Hadoop平台能够解决大数据的"5V"特点,即Volume(容量)、Variety(多样性)、Value(低价值密度)、Velocity(高速)、Veracity(真实性)。Apache Hadoop项目起源于开源网络搜