摘要

<正>2012年,Twitter上每天发布超过4亿条微博,Facebook上每天更新的照片超过1000万张,Farecast公司用将近10万亿条价格记录来预测机票价格,准确率高达75%,采用该系统购票,平均每张机票可节省50美元。2011年,麦肯锡公司对全世界大数据的分布作了一个研究和统计,中国2010年新增的数据量约为250PB,而欧洲约为2000PB,美国约为3500PB,大数据已经渗透到了人类经济社会生活的各个方面。如何获取、聚集、分析大数据成为广泛关注的热点问题。

全文