天天看點

Spark-ML-01-小試spark分析離線商品資訊

一個線上商品購買記錄資料集,約40M,格式如下:

完成統計:

1.購買總次數

2.客戶總個數

3.總收入

4.最暢銷的商品

簡單的RDD轉換和執行就可以簡單解決大資料的問題,java實作的代碼友善和以前的hadoop代碼結合執行。