天天看点

《Hadoop与大数据挖掘》一2.5.2 动手实践:K-Means算法实现

本节书摘来华章计算机《hadoop与大数据挖掘》一书中的第2章 ,第2.5.2节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

编写单机版的k-means算法有利于理解hadoop实现的k-means算法,所以这里给出单机版(java)的编写步骤,供读者参考。

实验步骤如下:

1)打开eclipse,新建java工程kmeans1.0;

2)参考前面的流程完善k-means代码;

3)使用测试数据hadoop/data/kmeans.data进行测试,查看结果;

4)思考把该算法转换为hadoop mapreduce实现的思路。