天天看點

《機器學習實戰》學習筆記

很久沒寫過部落格了,一重開就給自己挖了這麼一個大坑……

最近一段時間看了《機器學習實戰》這本書,感覺寫得不錯,認真看了看。關于這本書的書評及購買事宜請移步豆瓣、京東、亞馬遜等網站,這裡不多說。不過有一點,感覺這本書有個很好的地方是給出了各個算法的Python實作代碼和講解,要求不高的話可以拿來用了(懶)。在這裡想好好寫寫從這本書中學到的東西,文中的代碼和主要内容也将均來自這本書。

目錄

第一部分 分類

第1章 機器學習基礎

第2章 k-近鄰算法

第3章 決策樹

第4章 基于機率論的分類方法:樸素貝葉斯

第5章 Logistic回歸

第6章 支援向量機

第7章 利用Adaboost元算法提高分類性能

第二部分 利用回歸預測數值型資料

第8章 預測數值型資料:回歸

第9章 樹回歸

第三部分 無監督學習

第10章 利用K-均值聚類算法對未标注資料分組

第11章 使用Apriori算法進行關聯分析

第12章 使用FP-growth算法來高效發現頻繁項集

第四部分 其他工具

第13章 利用PCA來簡化資料

第14章 利用SVD簡化資料

第15章 大資料與MapReduce

本書的首頁:https://www.manning.com/books/machine-learning-in-action

書中的代碼和所使用的資料集可以在首頁或者這裡(作者的GitHub版本庫)找到。

書中有的代碼均使用Python 2.7,并廣泛使用了NumPy子產品,若幹章中還使用了Matplotlib子產品進行繪圖。可以安裝Python 2.7的官方發行版,然後依次安裝NumPy和Matplotlib子產品(需要解決依賴)。在這裡推薦直接安裝Python發行版Anaconda,已經内置了很多科學計算所需的子產品,可直接使用。

轉載于:https://www.cnblogs.com/qwertWZ/p/4510859.html