天天看點

《機器學習與資料科學(基于R的統計學習方法)》——1.4 機器學習背後的數學

本節書摘來異步社群《機器學習與資料科學(基于r的統計學習方法)》一書中的第1章,第1.4節,作者:【美】daniel d. gutierrez(古鐵雷斯),更多章節内容可以通路雲栖社群“異步社群”公衆号檢視。

為了讓這本書的閱聽人盡可能廣泛,我做了一個慎重的決定——省去數學。我對這個決定并不感到特别興奮,因為我堅信徹底了解機器學習需要深入了解每個算法的數學原理。雖然在學習的初始階段你不用數學也可以通過,但是我強烈期待在某些情況下,你想要回來重新學習每個算法,并鑽研它背後的數學原理。依我看來,數學基礎和機器學習方面的專業知識都是一個資料科學家必須的。在數學領域,你需要知道的包括數理統計(mathematical statistics)、機率論、微積分(calculus)、線性代數、偏微分方程群組合數學。

如果你在大學時沒有數學背景,什麼時候來打基礎都不算晚。現如今有很多可利用的資源來幫助你了解機器學習中數學的最新進展:諸如coursera、edx、mit公開課(mit opencourseware)和可汗學院(kahn academy)這樣的mooc。在youtube上搜尋上面提到的每個數學領域,會找到很多高品質的講座以進行關注和學習。

一旦你獲得了數學上的觀點,你将能夠回答現在越來越多突然出現的問題:“機器學習真的是科學嗎”?我在這個問題上的觀點是堅決肯定的!資料科學是多學科的融合,每一學科都是基于之前提到的數學領域。利用這些原理,你可以有效地應用我在前言中提到的“科學方法”。

繼續閱讀