天天看點

一進制線性回歸決定系數_2.1 一進制線性回歸

一進制線性回歸決定系數_2.1 一進制線性回歸

在複習了機率論和統計學的相關概念後,按照《計量統計學》内容的章節安排,開始自學第二篇“回歸分析基礎”的一進制線性回歸。

一進制線性回歸決定系數_2.1 一進制線性回歸

一進制線性回歸這一章的概念并不多,基本上是圍繞

一進制線性回歸模型

這一方程展開的,并對

系數的估計

回歸的方法

(最小二乘)、回歸方法也就是

最小二乘的假設

以及最小二乘一進制線性回歸的

拟合優度R^2

的介紹(1個中心+4個方面)。

一進制線性回歸模型的系數有什麼含義?其中

一進制線性回歸決定系數_2.1 一進制線性回歸

的含義最有意思,可以解釋為“X變化一個機關所引起的Y的變化”。這麼有意思的系數是怎麼求出來的呢?最小二乘。為什麼要選擇最小二乘這種方法來回歸呢?因為一是大家都用(相當于一種共識的語言,大家彼此都知道是基于什麼來進行讨論),二是無偏、一緻(可以較好的反映現實)。最小二乘要發揮出其對現實較好的反映程度或者說是對總體較好的估計程度,就不得不有一些前提假設來保證(詳見圖)。

就我個人的了解,回歸是一種思想。我們

使用計量方法所要解決的科學問題,就是在總體未知的前提下,通過随機方法擷取樣本,并根據樣本資料來估計總體特征。

其中,所使用的方法,就是回歸思想的工具載體。建立了一進制線性回歸的思想,我們使用一些基本的資料來解決一些簡單的問題。當問題更加複雜時,或者說一進制線性回歸無法較好的解決問題時,多元線性回歸就出場了——相比于一進制回歸,多元回歸能更好的消除遺漏變量導緻的偏差。當變量間的關系未必是線性時,非線性模型就有了更大的用武之地。

根據資料的不同類型,在一進制或多元回歸的基礎上,可以是分析面闆資料時可能會用到的固定效應模型,可以是分析二因值變量時用到的logit,可以是分析時間序列資料時用到的VAR模型;當然,也可以根據變量間的關系不同,比如雙向因果關系時,可能會用到工具變量等。也就是說,在掌握了一進制、多元線性與非線性的回歸基礎後,升階的方法是根據更加具體的研究問題(如解決問題所用的資料類型或變量間的不同關系)所決定的。當然,因為随着研究的推進,遇到的問題會更加瑣碎,為了更好的解決問題,可能方法在標明後還會有進一步優化或調整的需要。比如分析時間序列資料可以用到AR模型,但是涉及多個變量時可以用VAR模型;當資料類型是面闆資料(包含時間序列資訊)時甚至有PVAR模型。如果你選擇了PVAR模型來解決你的問題,一定是你先發現了問題,然後在解決問題的過程中根據需要一步一步地找到了PVAR模型;決不是你從一篇文章中看到了很炫的PVAR模型,然後為了運用這個模型而倉促的找了一個需要被解決的問題。

當你理清了計量方法在整個研究中的位置,整個自學過程其實就是種下了一顆種子,然後慢慢地長出來一棵技能樹。這棵技能樹上,主幹的部分當然要點亮(機率、統計與回歸基礎),有些枝桠要點亮(幾個常用的方法),但并不是所有的枝桠都需要點亮——你完全可以在需要的時候再去點它(不是那麼常用的方法),前提是你已經在心中有了這麼一棵樹。

下一章自學将迎來關于一進制線性回歸的假設檢驗與置信區間。重在點滴積累。