本節書摘來華章計算機《hadoop與大資料挖掘》一書中的第2章 ,第2.5.2節,張良均 樊 哲 位文超 劉名軍 許國傑 周 龍 焦正升 著 更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。
編寫單機版的k-means算法有利于了解hadoop實作的k-means算法,是以這裡給出單機版(java)的編寫步驟,供讀者參考。
實驗步驟如下:
1)打開eclipse,建立java工程kmeans1.0;
2)參考前面的流程完善k-means代碼;
3)使用測試資料hadoop/data/kmeans.data進行測試,檢視結果;
4)思考把該算法轉換為hadoop mapreduce實作的思路。