一個線上商品購買記錄資料集,約40M,格式如下: 完成統計: 1.購買總次數 2.客戶總個數 3.總收入 4.最暢銷的商品 簡單的RDD轉換和執行就可以簡單解決大資料的問題,java實作的代碼友善和以前的hadoop代碼結合執行。