天天看点

Spark-ML-01-小试spark分析离线商品信息

一个在线商品购买记录数据集,约40M,格式如下:

完成统计:

1.购买总次数

2.客户总个数

3.总收入

4.最畅销的商品

简单的RDD转换和执行就可以简单解决大数据的问题,java实现的代码方便和以前的hadoop代码结合执行。