【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

監督學習應用與梯度下降

本課内容：

1、線性回歸

2、梯度下降

3、正規方程組

（複習）監督學習：告訴算法每個樣本的正确答案，學習後的算法對新的輸入也能輸入正确的答案

1、線性回歸

例：Alvin汽車，先讓人開車，Alvin攝像頭觀看（訓練），而後實作自動駕駛。

本質是一個回歸問題，汽車嘗試預測行駛方向。

例：上一節課的房屋大小與價格資料集

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

引入通用符号：

m = 訓練樣本數

x = 輸入變量（特征）

y = 輸出變量（目标變量）

(x,y) – 一個樣本

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

–第i個訓練樣本 =

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

本例中：m：資料個數，x：房屋大小，y：價格

監督學習過程：

1) 将訓練樣本提供給學習算法

2) 算法生成一個輸出函數（一般用h表示，成為假設）

3) 這個函數接收輸入，輸出結果。（本例中為，接收房屋面積，輸出房價）将x映射到y。

如下圖所示：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

對假設進行線性表示：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

通常來說，回歸問題有多個輸入特征。如上例中，我們還已知房屋的卧室數，即有個第二個特征。即

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

表示大小，

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

表示卧室數，則可将假設寫成：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

為了将公式寫整潔，定義

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

，則h可寫成：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

n = 特征數目，

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

：參數

選擇

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

的目的，是使h(x)與y的平方差盡量小。又由于有m個訓練樣本，需要計算每個樣本的平方差，最後為了簡化結果乘以1/2，即：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

我們要做的就是求：min(J(

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

))

求min(J(

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

))方法：梯度下降和正規方程組

2、梯度下降

梯度下降是一種搜尋算法，基本思想：先給出參數向量一個初始值，比如0向量；不斷改變，使得J(

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

)不斷縮小。

改變的方法：梯度下降

如圖所示，水準坐标軸表示

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

，垂直坐标表示J(

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

)

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

一開始選擇0向量作為初始值，假設該三維圖為一個三維地表，0向量的點位于一座“山”上。梯度下降的方法是，你環視一周，尋找下降最快的路徑，即為梯度的方向，每次下降一小步，再環視四周，繼續下降，以此類推。結果到達一個局部最小值，如下圖：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

當然，若初始點不同，則結果可能為另一個完全不同的局部最小值，如下：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

表明梯度下降的結果依賴于參數初始值。

梯度下降算法的數學表示：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

為指派運算符，即表示程式中的的指派語句。

每一次将

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

減去

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

對

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

求偏導的結果，即沿最陡峭的“山坡”下降

将偏導數展開分析：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

代入上式：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

：學習速度，即決定你下山時每一步邁多大。設的過小，收斂時間長，設的過大，可能會超過最小值

（1）批梯度下降算法：

上述為處理一個訓練樣本的公式，将其派生成包含m個訓練樣本的算法，循環下式直至收斂：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

複雜度分析：

對于每個

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

的每次疊代，即上式所示，時間為O(m)

每次疊代（走一步）需要計算n個特征的梯度值，複雜度為O(mn)

一般來說，這種二次函數的

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

的三維圖形為一個碗狀，有一個唯一的全局最小值。其等高線為一個套一個的橢圓形，運用梯度下降會快速收斂到圓心。

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

梯度下降性質：接近收斂時，每次的步子會越來越小。其原因是每次減去

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

乘以梯度，但是梯度會越來越小，是以步子會越來越小。

下圖為使用梯度下降拟合的上例房屋大小和價格的曲線

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

檢測是否收斂的方法：

1) 檢測兩次疊代

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

的改變量，若不再變化，則判定收斂

2) 更常用的方法：檢驗

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

，若不再變化，判定收斂

批梯度下降算法的優點是能找到局部最優解，但是若訓練樣本m很大的話，其每次疊代都要計算所有樣本的偏導數的和，時間過慢，于是采用下述另一種梯度下降方法。

（2）随機梯度下降算法（增量梯度下降算法）：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

每次計算

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

不需要再周遊所有資料，而是隻需計算樣本i即可。

即批梯度下降中，走一步為考慮m個樣本；随機梯度下降中，走一步隻考慮1個樣本。

每次疊代複雜度為O(n)。當m個樣本用完時，繼續循環到第1個樣本。

上述使用了疊代的方法求最小值，實際上對于這類特定的最小二乘回歸問題，或者普通最小二乘問題，存在其他方法給出最小值，接下來這種方法可以給出參數向量的解析表達式，如此一來就不需要疊代求解了。

3、正規方程組

給定一個函數J，J是一個關于參數數組的函數，定義J的梯度關于的導數，它自己也是一個向量。向量大小為n+1維（從0到n），如下：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

是以，梯度下降算法可寫成：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

更普遍的講，對于一個函數f，f的功能是将一個m*n的矩陣映射到實數空間上，即：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

假設輸入為m*n大小的矩陣A，定義f關于矩陣A的導數為：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

導數本身也是個矩陣，包含了f關于A的每個元素的偏導數。

如果A是一個方陣，即n*n的矩陣，則将A的迹定義為A的對角元素之和，即：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

trA即為tr(A)的簡化。

一些關于迹運算符和導數的定理：

1) trAB = trBA

2) trABC = trCAB = trBCA

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

5) 若

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

，tra = a

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

有了上述性質，可以開始推導了：

定義矩陣X，稱為設計矩陣，包含了訓練集中所有輸入的矩陣，第i行為第i組輸入資料，即：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

則由于

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

，是以可得：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

又因為對于向量z，有

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

，則有：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

由上述最後一個性質可得：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

通過上述6個性質，推導：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

倒數第三行中，運用最後一個性質

将

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

置為0，則有：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

稱為正規方程組

可得：

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

【機器學習-斯坦福】學習筆記2 - 監督學習應用與梯度下降

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告