天天看點

Macheine Learning Yearning學習筆記(一)

Chapter1~Chapter 4談了一些基本概念

Chapter 1、Why Machine Learning Strategy (為什麼要學習機器學習政策)

這一章告訴我們機器學習政策的重要性,以一個實際的機器學習項目切入: 貓檢測算法,這是一個經典的計算機視覺領域的問題,判斷給定一張圖檔是否是貓。

Macheine Learning Yearning學習筆記(一)

當我們提出的算法準确性還不夠好的時候,我們應該怎麼做?這個時候我們可能會面臨很多想法的選擇,例如:

(1) 擷取更多的資料:收集更多的貓的照片

(2) 收集更多樣化的訓練集。例如,貓在不尋常的位置的圖檔;不尋常顔色

的貓;不同相機設定下拍攝出的貓圖; ....

(3) 增加算法運算的時間,比如增加梯度下降算法的疊代次數

(4) 嘗試更大的神經網絡,比如增加網絡的層數(網絡的深度),隐藏機關的個數(網絡的寬度),這樣網絡會具備更多的參數,進而表征能力更強

(5) 嘗試更小的神經網絡

(6) 嘗試添加正則化(例如L2正則化)

(7) 改變神經網絡架構(激活功能,隐藏機關數等)

(8) 還有許多其它的idea嘗試……

在這些可能會提高準确性的想法中,如果一開始就選擇的好,那麼會節約很多時間,進而提升效果;如果選擇的不恰當,那麼可能會浪費大量的時間去進行這些嘗試。那麼知道了這些,當我們遇到這種情況時,我們應該如何抉擇?NG的這本書就是出自這個目的寫的。很多機器學習問題給人們留下了很多可以借鑒的經驗,這些經驗會告訴你,那些嘗試是有用的,那些嘗試是作用不大的,而學習這些經驗可能會節約我們很多瞎嘗試的時間。

Chapter 2、How to use this book to help your team (如何使用本書幫助團隊)

這一章說了自己為什麼每一章都寫那麼短,這樣列印出來也比較友善,随時可看~.~

Chapter 3、Prerequisites and Notation(基本概念)

要熟悉基本的機器學習概念, 如果不熟悉,可以先移步NG的經典機器學習視訊。

善良的我已經找好了連結:http://open.163.com/special/opencourse/machinelearning.html

  • 監督學習(supervised learning):使用标記的訓練樣本(x,y)去學習一個從x映射到y的函數。
  • 監督學習包括:線性回歸(linear regression)、邏輯回歸(logistic regression)、K-近鄰算法(K-Nearest Neighbors)、決策樹(Decision Trees)、樸素貝葉斯(Naive Bayesian)、神經網絡(neural networks)(也稱為”deep learning”)等。
  • 無監督學習包括:聚類(clustering)、降維(reducing dimensionality)

Chapter 4、Scale drives machine learning progress (資料規模驅動了機器學習的程序)

深度學習(神經網絡)不是新東西,已經存在幾十年了,為什麼現在才火起來?這個主要是由以下原因:

  • 資料可用性:人們在數字裝置(如電腦)的活動嘗試了大量的資料,這些資料可以用來訓練和喂給(feed)我們的學習算法。
  • 算力:現在計算機的計算能力提升,使得能夠計算更複雜網絡和使用更大的資料訓練。

舉個例子:

即使資料量足夠大,傳統算法(如邏輯回歸)在某個任務上表現性能也是”平穩”的。如下圖,意思就是說即使給它更多的資料,算法也不會再有很大的提升效果。

Macheine Learning Yearning學習筆記(一)

這其實就是在某些任務上,傳統算法的函數表征能力不足以學習到這麼多資料。這個時候神經網絡就登上曆史舞台了。

Macheine Learning Yearning學習筆記(一)

在這種情況下,我們會得到更好的性能,當我們有:

(1)訓練一個非常大的神經網絡,使其在上面的綠色曲線上;

(2)有大量的資料。

當然神經網絡的架構也很重要,這一點也有很多創新。

但是現在提高算法性能的更可靠的方法之一仍然是:

(1)訓練更大的網絡;

(2)獲得更多的資料。

如何合适的完成(1)和(2)的方法是極其複雜的,這也是NG這本書要詳細讨論的事情。

注意:上圖Small NN指的是具有相對較少的隐藏單元、隐藏層、參數的神經網絡。

參考:

1.http://www.mlyearning.org/

2.https://xiaqunfeng.gitbooks.io/machine-learning-yearning/content/

更多個人筆記請關注:

知乎專欄:https://www.zhihu.com/people/yuquanle/columns

公衆号:StudyForAI(小白人工智能入門學習)