本节书摘来华章计算机《hadoop与大数据挖掘》一书中的第2章 ,第2.5.2节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
编写单机版的k-means算法有利于理解hadoop实现的k-means算法,所以这里给出单机版(java)的编写步骤,供读者参考。
实验步骤如下:
1)打开eclipse,新建java工程kmeans1.0;
2)参考前面的流程完善k-means代码;
3)使用测试数据hadoop/data/kmeans.data进行测试,查看结果;
4)思考把该算法转换为hadoop mapreduce实现的思路。