數學模組化:回歸分析
圖檔來自清風數學模組化
回歸分析概述
-
目的
研究X和Y之間相關性的分析,嘗試去解釋Y的形成機制,進而達到通過X預測Y的目的
多數情況下難以探究嚴格的因果關系,故退而求次,通過回歸分析探究相關關系。
- 三個使命:
- 識别重要變量:識别判斷哪些X與Y真正相關
- 判斷相關性方向:正相關?負相關?
- 估計權重(回歸系數):賦予不同X不同的權重(展現不同自變量之間的相對重要性)
- 分類
數學模組化:回歸分析數學模組化:回歸分析
關于資料
- 資料分類
- 橫截面資料:某一時間點收集的不同對象的資料(例:全國2018各省GDP),利用多元線性回歸模組化分析
- 時間序列資料:同一對象不同時間連續觀察所得(例:中國曆年GDP),利用ARIMA
- 面闆資料:上述兩種資料結合起來(2008-2018全國各省份GDP)
- 資料擷取
- 簡道雲彙總
- 可以自學爬蟲
一進制線性回歸
- 模型
數學模組化:回歸分析數學模組化:回歸分析 - “線性”了解
數學模組化:回歸分析數學模組化:回歸分析
多元線性回歸
- 回歸系數解釋
- 遺漏變量會導緻内生性,也即回歸系數受引入自變量個數影響很大:
數學模組化:回歸分析數學模組化:回歸分析 數學模組化:回歸分析數學模組化:回歸分析 -
寫論文一般要對回歸模型中的核心解釋變量(的系數)進行一下解釋:
y i = β 0 ^ + β 1 ^ x 1 i + . . . + β k ^ x k i y_{i} = \hat{\beta_{0}} +\hat{\beta_{1}}x_{1i} +... + \hat{\beta_{k}}x_{ki} yi=β0^+β1^x1i+...+βk^xki
- β ^ 0 \hat{\beta}_{0} β^0意義一般不考慮(所有自變量一般不會同時為0)
- β m ^ \hat{\beta_{m}} βm^表示控制其他自變量不變的情況下, x m i x_{mi} xmi每增加一個機關,對 y i y_{i} yi造成的變化,實際上就是數學偏導定義: β m ^ = ∂ y i ∂ x m i \hat{\beta_{m}} = \frac{\partial y_{i}}{\partial x_{mi}} βm^=∂xmi∂yi,故多元線性回歸模型的回歸系數也稱偏回歸系數。
- 遺漏變量會導緻内生性,也即回歸系數受引入自變量個數影響很大:
- 多分類虛拟變量設定
數學模組化:回歸分析數學模組化:回歸分析 - 含有互動項自變量
回歸分析執行個體
通過實操掌握概念,計算,分析過程
excel表格的強大功能
stata軟體計算回歸系數