聚類主要内容是将樣本進行歸類,同種類别的樣本放到一起,所有樣本最終會形成K個簇,它屬于無監督學習。
根據給定的K值和K個初始質心将樣本中每個點都分到距離最近的類簇中,當所有點配置設定完後根據每個類簇的所有點重新計算質心,一般是通過平均值計算,然後再将每個點分到距離最近的新類簇中,不斷循環此操作,直到質心不再變化或達到一定的疊代次數。數學上可以證明k-means是收斂的。

需要事先确定類簇的數量。
質心的選取會影響最終的聚類結果。
結果:
直接用機器學習庫更加友善
========廣告時間========
<a href="http://blog.csdn.net/wangyangzhizhou/article/details/74080321">為什麼寫《Tomcat核心設計剖析》</a>
=========================
歡迎關注公衆号: