天天看點

《Hadoop與大資料挖掘》一2.5.2 動手實踐:K-Means算法實作

本節書摘來華章計算機《hadoop與大資料挖掘》一書中的第2章 ,第2.5.2節,張良均 樊 哲 位文超 劉名軍 許國傑 周 龍 焦正升 著 更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

編寫單機版的k-means算法有利于了解hadoop實作的k-means算法,是以這裡給出單機版(java)的編寫步驟,供讀者參考。

實驗步驟如下:

1)打開eclipse,建立java工程kmeans1.0;

2)參考前面的流程完善k-means代碼;

3)使用測試資料hadoop/data/kmeans.data進行測試,檢視結果;

4)思考把該算法轉換為hadoop mapreduce實作的思路。