天天看點

【機器學習機率統計】09 推斷未知:統計推斷的基本架構

1.進入統計學

從這一講開始,我們進入到統計推斷的主題。

統計學使用機率論的基本方法,研究怎樣通過試驗收集帶有随機誤差的樣本資料,并在設定的統計模型之下,進行後續的研究工作,主要分為兩大類:

第一類是對這些已有的樣本資料進行分析,計算他們的一些統計特征,比如樣本均值、方差等等,即描述統計的範疇。

第二類是更重要的,是通過這些已有的樣本資料,對整個未知的總體進行推斷,估計出總體當中我們感興趣的未知參數值,即統計推斷的工作,這是我們重點關注的内容。

那我們為什麼需要關注統計推斷的方法呢?因為,當我們需要對一個未知的對象進行分析時,一般需要通過擷取資料來分析這個對象,但在現實當中,我們隻能擷取一部分資料而無法擷取總體的全部資料。而統計推斷研究的就是通過部分的樣本資料來推斷總體統計特征的方法。

上面的描述當中,有很多的術語和概念,為了便于大家了解,我們來舉一個統計推斷的例子

2.統計推斷的例子

有一家企業生産電子元器件,這些元器件的壽命服從指數分布,那麼我們如何估計這些元器件的平均壽命呢?如果我們知道這個指數分布的參數 λ \lambda