吳恩達《機器學習》課程總結（19）總結

2018-07-06 23:50:00

(1)涉及到的算法

1.監督學習：線性回歸，邏輯回歸，神經網絡，SVM。

線性回歸（下面第三行x0(i)其實是1，可以去掉）

吳恩達《機器學習》課程總結（19）總結

邏輯回歸

吳恩達《機器學習》課程總結（19）總結

神經網絡（寫出前向傳播即可，反向架構會自動計算）

吳恩達《機器學習》課程總結（19）總結

SVM

吳恩達《機器學習》課程總結（19）總結

2.非監督學習：聚類算法(K-mean),降維(PCA)

K-mean

吳恩達《機器學習》課程總結（19）總結

PCA

吳恩達《機器學習》課程總結（19）總結

3.異常檢測

吳恩達《機器學習》課程總結（19）總結

4.推薦系統

吳恩達《機器學習》課程總結（19）總結

(2)政策

1.偏差與方差，正則化

訓練誤差減去人類最高水準為偏差(欠拟合)，交叉驗證集誤差減訓練誤差為方差(過拟合)；

正則化解決方差問題，不對θ0正則化；

2.學習曲線

全過程觀測偏差與方差，是以更全面。

3.誤差分析

找到哪種原因造成誤差最大，最該花時間的地方。

4.評價方法

盡量使用單一名額評價，準确率不适合類偏斜，用精确度和召回率判定

精确度是預測的視角（預測為正樣本中有多少是正樣本），召回率是樣本視角（正樣本有多少被預測到了）

F1=2（PR）/（P+R）

5.資料集的拆分

訓練集用于訓練模型，，交叉驗證集用于篩選模型/調參，測試集用來做最終評價。

6.上限分析

每一步假設輸出完全正确時，能提高多少的正确率，提高最高的地方就是最該馬上花時間解決的地方。

(3)應用

1.OCR

檢測，分割，識别，現在常常不分割了，直接序列化識别。

2.大規模的機器學習

小批量的訓練方法以及使用并行計算。

機器學習/深度學習算法資料挖掘搜尋推薦并行計算運維機器學習課程總結機器學習課程總結變量機器學習課程總結線性回歸學習遠端服務學習線程

上一篇: 【譯】準備好你求職時候用的 GitHub 賬号

下一篇: 1月第1周業務風控關注| 國家網信辦啟動專項行動劍指12類違法違規網際網路資訊

繼續閱讀