機器學習(3)——多變量線性回歸

2023-03-29 10:13:48

【一、多變量線性回歸模型】

多變量線性回歸是指輸入為多元特征的情況，例如：

機器學習(3)——多變量線性回歸

在上圖中可看出房子的價格price由四個變量(size、number of bedrooms、number of floors 、age of home)決定，為了能夠預測給定條件（四個變量）下的房子的價格（y），我們需要建立相應的線性回歸模型。

假設有n個變量，則相應的多變量線性回歸模型如下：

機器學習(3)——多變量線性回歸

注意上圖中的x是指一個訓練樣本，即每個訓練樣本都是一個（n+1）維向量（包含附加的x0=1）

【二、代價函數】

多變量線性回歸的代價函數如下：

機器學習(3)——多變量線性回歸

其中x(i)代表第i個樣本

【三、梯度下降法尋找最佳theta】

機器學習(3)——多變量線性回歸

下面列出單變量線性回歸梯度下降法（左）與多變量線性回歸梯度下降法（右）

機器學習(3)——多變量線性回歸

其中α為學習率。

【梯度下降法的兩個細節處理】：

1. Feature Normalization

By looking at the values, note that house sizes are about 1000 times the number of bedrooms. When features differ by orders of magnitude, first performing feature scaling can make gradient descent converge much more quickly。

也就是說當特征之間相差很大時，例如房子的大小與卧室的數量，這樣會導緻梯度下降收斂比較慢，如下圖（左邊）所示，當對特征進行正規後，梯度下降收斂變快，如下圖（右邊）所示。

機器學習(3)——多變量線性回歸

正規化方法可以使用mean value and the standard deviation 法，或者其他方法。

機器學習(3)——多變量線性回歸

2. Selecting learning rates

學習率的正确選擇應該保證每一步疊代後cost function都是下降的，如下圖所示：

機器學習(3)——多變量線性回歸

如果學習率α過大，可能會使得代價函數上升，而不是一直呈現下降趨勢，如下圖。

機器學習(3)——多變量線性回歸

但是學習率α過小，那個梯度下降的收斂速度會太慢。

【選取學習率的方法】

機器學習(3)——多變量線性回歸

【四、正規方程解最佳theta】

機器學習(3)——多變量線性回歸

，j=0,1，…………n

由

機器學習(3)——多變量線性回歸

則

機器學習(3)——多變量線性回歸

注意出現下列情況時：

機器學習(3)——多變量線性回歸

這時可以進行備援feature的删除

機器學習(3)——多變量線性回歸

【一、多變量線性回歸模型】

【二、代價函數】

【三、梯度下降法尋找最佳theta】

【四、正規方程解最佳theta】

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告