天天看點

資料回歸方法(一)——一進制回歸

1.需求引入

有聯系的事物之間存在着特定的關系。将事物抽象為變量,即變量之間存在着特定的關系。回歸(regression)方法就是建立變量之間互相關系模型的數學方法。具體點說,在回歸中,假定因變量Y和自變量X之間的模型,然後計算模型中的系數。

回歸分類:

1.按照因變量個數、模型類型,可分為

①一進制線性;②一進制非線性;③多元線性;④多元非線性。

2.兩種特殊方式:

  • 逐漸回歸:回歸過程中可以調整變量數;
  • Logistic回歸:以指數結構函數作為回歸模型。

2.一進制回歸

2.1一進制線性回歸

一個自變量x和因變量Y的線性關系模型:

資料回歸方法(一)——一進制回歸

Y——因變量,x——自變量,β0、β1 ——未知參數,稱回歸系數,ε ——随機誤差,

資料回歸方法(一)——一進制回歸

,var(ε)=σ2>0

如何建立回歸方程?分二步:

①确定能否建立線性回歸模型;

②确定如何對模型中未知參數β0、β1 進行評估。

下面詳細解釋其過程。

⑴對總體(x,Y)進行n次獨立觀測,獲得n組觀測值:

資料回歸方法(一)——一進制回歸

⑵在直角坐标系中畫出觀測值對應的點(xi,yi) 的散點圖。

如果這些點大緻位于同一條直線附近,則認為Y與x之間存線上性關系。

⑶利用最小二乘法得到

資料回歸方法(一)——一進制回歸

的最小二乘估計

資料回歸方法(一)——一進制回歸

,估計公式為

資料回歸方法(一)——一進制回歸

其中,

資料回歸方法(一)——一進制回歸

于是建立了經驗模型:

資料回歸方法(一)——一進制回歸

⑷回歸效果評價。

3個評價參數:

資料回歸方法(一)——一進制回歸

SSE表征y的估計值與實際值的偏差程度。

資料回歸方法(一)——一進制回歸

SST表征y與y平均值的偏差程度。

資料回歸方法(一)——一進制回歸

SSR表征兩種偏差之間的內插補點。

三個評價準則:

  • 決定系數
資料回歸方法(一)——一進制回歸
資料回歸方法(一)——一進制回歸

,

資料回歸方法(一)——一進制回歸

大,說明SSE相對SST小,表示總體上看,yi與

資料回歸方法(一)——一進制回歸

比較靠近,驗證模型可靠。

  • 剩餘标準差
資料回歸方法(一)——一進制回歸

S值越小,說明SSE越小,經驗模型與實際越接近。

  • F檢驗
資料回歸方法(一)——一進制回歸

通過R、S和F的值,判斷模型是否具有良好線性關系。

⑸确定最精确的一進制線性回歸模型,并可以利用該模型對Y進行預測。

2.2一進制非線性回歸

       實際問題中,變量間的關系有的是非線性關系,應該用曲線進行拟合。

⑴解決的基本思路:

①對于曲線回歸模組化的目标函數

資料回歸方法(一)——一進制回歸

,通過中間變換

資料回歸方法(一)——一進制回歸

使目标函數線性化,化為一進制線性函數

資料回歸方法(一)——一進制回歸

形式。

②利用最小二乘估計法估計出參數a和b,用

資料回歸方法(一)——一進制回歸

描述v與u之間的統計規律。

③用逆變換

資料回歸方法(一)——一進制回歸

還原為目标函數形式的非線性回歸方程。

⑵常見的非線性回歸模型

這些常見模型常作為非線性回歸拟合的參考模型。

①倒幂函數

資料回歸方法(一)——一進制回歸
資料回歸方法(一)——一進制回歸

函數圖形

②幂函數

資料回歸方法(一)——一進制回歸
資料回歸方法(一)——一進制回歸

0<b<1

資料回歸方法(一)——一進制回歸

b<0

資料回歸方法(一)——一進制回歸

b>1

③指數函數

資料回歸方法(一)——一進制回歸
資料回歸方法(一)——一進制回歸

b>0

資料回歸方法(一)——一進制回歸

b<0

④倒指數函數

資料回歸方法(一)——一進制回歸
資料回歸方法(一)——一進制回歸

b>0

資料回歸方法(一)——一進制回歸

b<0

⑤對數函數

資料回歸方法(一)——一進制回歸
資料回歸方法(一)——一進制回歸

b>0

資料回歸方法(一)——一進制回歸

b<0

⑥S型曲線

資料回歸方法(一)——一進制回歸
資料回歸方法(一)——一進制回歸

如何使用這些常見的非線性回歸模型:

  1. 首先,根據執行個體中的變量趨勢,結合常見的非線性函數的圖像,大概可以判斷執行個體屬于哪種非線性關系。(實際這幾種函數圖形比較接近,使用時可能都要試一下)
  2. 然後,根據選擇好的函數形式,利用中間變換,進行非線性拟合。
  3. 最後,從幾個可能的拟合結果中,根據回歸效果評價準則,選擇最好的回歸結果。

繼續閱讀