天天看點

數學模組化:回歸分析數學模組化:回歸分析

數學模組化:回歸分析

圖檔來自清風數學模組化

回歸分析概述

  1. 目的

    研究X和Y之間相關性的分析,嘗試去解釋Y的形成機制,進而達到通過X預測Y的目的

    多數情況下難以探究嚴格的因果關系,故退而求次,通過回歸分析探究相關關系。
  1. 三個使命:
    • 識别重要變量:識别判斷哪些X與Y真正相關
    • 判斷相關性方向:正相關?負相關?
    • 估計權重(回歸系數):賦予不同X不同的權重(展現不同自變量之間的相對重要性)
  1. 分類
    數學模組化:回歸分析數學模組化:回歸分析

關于資料

  1. 資料分類
    • 橫截面資料:某一時間點收集的不同對象的資料(例:全國2018各省GDP),利用多元線性回歸模組化分析
    • 時間序列資料:同一對象不同時間連續觀察所得(例:中國曆年GDP),利用ARIMA
    • 面闆資料:上述兩種資料結合起來(2008-2018全國各省份GDP)
  1. 資料擷取
    • 簡道雲彙總
    • 可以自學爬蟲

一進制線性回歸

  1. 模型
    數學模組化:回歸分析數學模組化:回歸分析
  2. “線性”了解
    數學模組化:回歸分析數學模組化:回歸分析

多元線性回歸

  1. 回歸系數解釋
    • 遺漏變量會導緻内生性,也即回歸系數受引入自變量個數影響很大:
      數學模組化:回歸分析數學模組化:回歸分析
      數學模組化:回歸分析數學模組化:回歸分析
    • 寫論文一般要對回歸模型中的核心解釋變量(的系數)進行一下解釋:

      y i = β 0 ^ + β 1 ^ x 1 i + . . . + β k ^ x k i y_{i} = \hat{\beta_{0}} +\hat{\beta_{1}}x_{1i} +... + \hat{\beta_{k}}x_{ki} yi​=β0​^​+β1​^​x1i​+...+βk​^​xki​

      • β ^ 0 \hat{\beta}_{0} β^​0​意義一般不考慮(所有自變量一般不會同時為0)
      • β m ^ \hat{\beta_{m}} βm​^​表示控制其他自變量不變的情況下, x m i x_{mi} xmi​每增加一個機關,對 y i y_{i} yi​造成的變化,實際上就是數學偏導定義: β m ^ = ∂ y i ∂ x m i \hat{\beta_{m}} = \frac{\partial y_{i}}{\partial x_{mi}} βm​^​=∂xmi​∂yi​​,故多元線性回歸模型的回歸系數也稱偏回歸系數。
  1. 多分類虛拟變量設定
    數學模組化:回歸分析數學模組化:回歸分析
  2. 含有互動項自變量
數學模組化:回歸分析數學模組化:回歸分析

回歸分析執行個體

通過實操掌握概念,計算,分析過程

excel表格的強大功能

stata軟體計算回歸系數

繼續閱讀