摘要

为降低客户端和服务端之间的远程过程调用(RPC)通讯,提高对存储空气质量监测数据的HBase表的区间统计效率,提出了一种基于协处理器的大数据区间统计方法。使用终端协处理器可以将区间统计过程放在服务端运行,通过特定的协议将区间统计所需的参数从客户端传递到服务端,协处理器调用结束后,将结果返回到客户端,客户端对返回的消息进行处理汇总,最终得到区间统计结果。实验证明,使用终端协处理器进行空气质量监测数据区间统计较使用客户端扫描方式至少快一个数量级,极大地提高了统计效率。