天天看點

SPSS——基本的統計概念SPSS——基本的統計概念總體和樣本随機變量統計量

SPSS——基本的統計概念

總體和樣本

總體和個體

研究對象的全體成為總體,一般地把我們關心的随機變量X成為總體。組成總體的每個單元稱為個體。個體也可了解為總體X的取值

簡單随機抽樣

為了使抽樣具有充分的代表性,要求

  • 每個個體被抽到的機會均等
  • 每次抽取都是獨立的(共抽取n次)

通常的抽樣都是無放回的,當總體很大的時,可以滿足獨立性

樣本

總體是指考察的對象的全體, 個體是總體中的每一個考察的對象, 樣本是總體中所抽取的一部分個體, 而樣本容量則是指樣本中個體的數目。

在總體中抽取n個個體,成為總體上的一個樣本,記為(X1, X2, …, Xn),其中每次抽樣Xi(i=1,2,3..,n)也都是随機變量,共n個随機變量,加上括号,表示樣本是一個整體

獨立同分布

在機率統計理論中,如果變量序列或者其他随機變量有相同的機率分布,并且互相獨立,那麼這些随機變量是獨立同分布。

随機變量X1和X2獨立,是指X1的取值不影響X2的取值,X2的取值也不影響X1的取值.随機變量X1和X2同分布,意味着X1和X2具有相同的分布形狀和相同的分布參數,對離散随機變量具有相同的分布律,對連續随機變量具有相同的機率密度函數,有着相同的分布函數,相同的期望、方差。反之,若随機變量X1和X2是同類型分布,且分布參數完全相同,則X1和X2完全一定同分布!

如實驗條件保持不變,一系列的抛硬币的正反面結果是獨立同分布。

随機變量

随機變量(random variable)表示随機試驗各種結果的實值單值函數。

一個随機試驗可能結果(稱為基本事件)的全體組成一個基本空間Ω。随機變量X是定義在基本空間Ω上的取值為實數的函數,即基本空間Ω中每一個點,也就是每個基本事件都有實軸上的點與之對應。例如,随機投擲一枚硬币,可能的結果有正面朝上 ,反面朝上兩種 ,若定義X為投擲一枚硬币時朝上的面 , 則X為一随機變量,當正面朝上時,X取值1;當反面朝上時,X取值0。又如,擲一顆骰子,它的所有可能結果是出現1點、2點、3點、4點、5點和6點 ,若定義X為擲一顆骰子時出現的點數,則X為一随機變量,出現1,2,3,4,5,6點時X分别取值1,2,3,4,5,6。

SPSS——基本的統計概念SPSS——基本的統計概念總體和樣本随機變量統計量

統計量

統計量是含有樣本X1, X2, …, Xn的一個數學表達式,并且表達式中不包含未知參數,是以可以在得到樣本後計算出它的數值。

在抽樣之前,統計量的值無法确定,抽樣測試後,可以觀察到它的取值,是以統計量是随機變量,是由樣本派生出來的随機變量。

樣本均值

均值描述的是樣本集合的中間點,它告訴我們的資訊是很有限的

SPSS——基本的統計概念SPSS——基本的統計概念總體和樣本随機變量統計量

樣本标準差

标準差給我們描述的則是樣本集合的各個樣本點到均值的距離之平均。以這兩個集合為例,[0,8,12,20]和[8,9,11,12],兩個集合的均值都是10,但顯然兩個集合差别是很大的,計算兩者的标準差,前者是8.3,後者是1.8,顯然後者較為集中,故其标準差小一些,标準差描述的就是這種“散布度”。之是以除以n-1而不是除以n,是因為這樣能使我們以較小的樣本集更好的逼近總體的标準差,即統計上所謂的“無偏估計

我們知道,樣本量越大越能反映真實的情況,而算數均值卻完全忽略了這個問題,對此統計學上早有考慮,在統計學中樣本的均差多是除以自由度(n-1),它是意思是樣本能自由選擇的程度。當選到隻剩一個時,它不可能再有自由了,是以自由度是n-1。

n-1中的-1就是為了在考慮樣本标準差自由度上做的一個調配系數,既定為1,,假設計算的标準差所對應的資料列隻有1個資料,則1-1=0,不存在标準差,,以此證明-1為調配系數,,所及請記住一般算标準差是,,都是算樣本資料的标準差,即:(n-1分之 各個資料與平均數內插補點的平方和)的2次方根。

SPSS——基本的統計概念SPSS——基本的統計概念總體和樣本随機變量統計量

樣本方差

方差則僅僅是标準差的平方。

即樣本方差計算公式裡分母為n-1的目的是為了讓方差的估計是無偏的。無偏的估計(unbiased estimator)比有偏估計(biased estimator)更好是符合直覺的

SPSS——基本的統計概念SPSS——基本的統計概念總體和樣本随機變量統計量

協方差

SPSS——基本的統計概念SPSS——基本的統計概念總體和樣本随機變量統計量

協方差矩陣

SPSS——基本的統計概念SPSS——基本的統計概念總體和樣本随機變量統計量

繼續閱讀