一个在线商品购买记录数据集,约40M,格式如下: 完成统计: 1.购买总次数 2.客户总个数 3.总收入 4.最畅销的商品 简单的RDD转换和执行就可以简单解决大数据的问题,java实现的代码方便和以前的hadoop代码结合执行。