天天看點

結構方程模型(SEM)的假設(2)

結構方程模型(sem)的假設

合理的樣本量

sem是一般線性模型靈活有力的擴充。像其它統計方法一樣,需要一系列假設。這些假設應該滿足或至少近似地保證有可信賴的結果。

按 照james stevens的社會科學的應用多變量統計的說法,一個好的經驗法則是在标準普通最小二乘多重回歸分析中每個因子有15個個案。因為sem在某些方面與多 重回歸緊密相關,sem中每個測量變量15個個案是合理的。bentler 和chou (1987) 注意到隻要資料表現良好(例如,正态分布,無缺失資料或例外值等等),在sem分析中研究者對每個參數估計,隻需要5個個案。注意bentler

和chou 提及每個參數估計要有5個個案而不是每個測量變量。測量變量在分析中至少有一個典型地路徑系數與其它變量相關聯,加上殘差項或方差估計,是以認可 bentler 和chou 和stevens推薦的每個測量變量最小要15個個案相吻合是重要的。更一般的, loehlin (1992) 使用驗證性因子分析模型報告蒙特卡洛仿真的研究結果,參考一些文獻後,得出對兩到四因子模型,調查者應該收集至少100個個案,200更好(如果可能)。 使用小樣本的結果包括疊代失敗 (軟體不能達到滿意的解), 不合理的解 (包括測量變量的方差估計為負值)和降低參數估計的準确性,尤其是,标準誤–

sem的标準誤是在大樣本假設下進行計算的。

當資料是非正态分布或在某些方面是有缺陷的情況下 (幾乎總是對個案),需要較大的樣本。當資料有偏斜,有高低峰,不完整或不盡合理時,對所需要的樣本量做出絕對的推薦是困難的。一般的推薦是盡可能獲得較多的資料。

内生變量的連續和正态分布

sem程式假設因變量和中間變量(所謂的内生變量是sem的叫法) 是連續分布,有正态分布的殘差。事實上,sem分析的殘差不僅僅要求服從單變量正态分布,它們的聯合分布也要服從聯合多變量正态分布。然而,這個假設在實際中從未滿足。

sem專家已經開發多種方法處理非正态分布變量。這些方法是為假設有潛在連續分布的變量而設計。 例如,也許你管理一個研究參與者自信心項目的李克特量表。量表按照自信的連續程度由低到高計分,即使項目資料不是連續分布,潛在自信分布也是連續的。

相反,其它結果變量不是連續分布。例如,醫學研究中病人處理後是生還是死?大部分sem程式目前不能處理這些名義水準因變量的類型。

模型識别 (識别方程)

如 不久所見,為了産生有判斷力的一組結果,sem程式需要已知足夠數量的相關陣或協方差陣作為輸入。另一個要求是方程完全可識别。在sem中,識别涉及參數 估計至少有一個唯一解的概念。參數估計隻有一個可能解的模型稱為恰好識别。有無限可能參數估計值的模型叫做欠識别。最後,參數估計多于一個可能解(除了一 個最佳或最優解外)的模型叫做過度識别。

下列方程,來自rigdon (1997),或許可以幫助更清晰的了解這些概念:

x + 2y = 7

在上面方程中,x 和 y 有無窮多個解(例如, x = 5 和 y =1, x = 3 和 y = 2)。因為“已知”比“未知”少,是以這些值是欠識别的。恰好識别模型是方程個數與變量個數相同的方程。

3x - y = 7

對這個方程,方程個數與變量個數相同,進而有一對最佳值 (x = 3, y = 2)。

當 每個參數可識别,至少一個參數是過度識别時,會出現過度識别模型(例如,方程能由多種方式求解——而不是帶一個方程的參數解,多個方程都會産生這種參數估 計)。多數使用sem的人都喜歡使用過度識别。過度識别模型有正自由度,也不必拟合恰好識别模型。當有過度模型時,施加在模型上的限制提供一組假設檢驗, 然後它能被絕對拟合模型的卡方統計量和各種描述模型拟合指數估計。與過度識别模型相關的正自由度允許模型有虛假的卡方檢驗。當過度識别模型拟合良好時,研

究者通常認為模型有足夠的拟合資料。

為了進行sem 分析,識别是結構上或數學上的需要。許多規則能用于評價模型的識别水準,但這些規則不完善,用紙筆計算(事實上,幾乎不可能)非常困難,尤其是複雜模型。 sem 軟體例如amos把執行識别檢查作為模型拟合過程的一部分。它們通常提供有關欠識别條件的合理警告。

能出現另一個複雜化的情 況是經驗欠識别。當設定識别模型有非常小(接近0)估計的參數估計時,會出現經驗欠識别。當sem進行矩陣逆運算時,參數估計在模型參數定義的解空間中下 降,這樣程式突然偵測到結構欠識别問題是什麼。由于sem估計的自然疊代,參數估計例如方差從正值開始在一次一次疊代中漸漸地接近0。例如,估計值接近0 的路徑系數在sem矩陣逆運算算法中被當作0來處理。如果路徑系數識别模型是必須的,那麼模型就變成欠識别。

各種形式欠識别模式的補救方法是設法找到識别問題的來源和确定來源是經驗欠識别還是結構欠識别。對結構欠識别,唯一的補救方法是重新定義模型。經驗欠識别通過收集更多的資料或重新定義模型來校正。

rigdon (1997)的例子可以說明這些問題。考慮下列模型:

結構方程模型(SEM)的假設(2)

它包含一個因子f1,兩個誤差或殘差e1 和 e2,一個因子載荷連接配接f1 到 i2。模型需要估計四個參數:因子的方差,兩個誤差方差和一個因子載荷。

有多少可利用的輸入能在分析過程中使用?三個。怎麼知道要有輸入三個變量?可以使用下面公式

[q(q + 1)] / 2

這裡q 表示模型資料庫中測量變量的數目。在這個模型中有兩個觀測變量, i1 和 i2,是以由上面公式顯示, [2(2+1)]/2 = 3。有兩個方差,一個是兩個變量都有的方差,一個是i1 和 i2間協方差。

用三個輸入估計四個未知參數怎麼可能呢?答案是這是不可能的:有三個已知變量或可利用的自由度,但有四個未知參數要估計,是以模型的自由度是 3 – 4 = -1 ,明顯地不可能。模型是欠識别——為了得到滿意識别水準,需要利用這個模型增加限制。

現在考慮第二個模型:

結構方程模型(SEM)的假設(2)

因 為模型使用四個觀測變量,是以新模型有 [4(4+1)] / 2 = 10個自由度。從10個自由度中減去四個誤差方差,兩個因子載荷和兩個因子方差,一個因子間的協方差結果剩下一個自由度。在結構上模型是可識别的。事實 上,因為現在有一個正自由度,是以它是過度識别。

事實表明,如果f1 和 f2的協方差參數估計恰好變成零或非常接近零,模型變成經驗欠識别,因為即使在f1 和 f2間通過定義協方差在結構上識别它,從計算機軟體觀點看,依據經驗它不會被識别。

實際上,所有成功的拟合模型是恰好識别或過度識别。通常使用過度識别模型因為這些模型允許檢驗統計假設,包括整體模型拟合(loehlin, 1992)。

完整資料或缺失資料的适當處理

許多sem軟體接受相關陣或協方差陣的輸入。換句話說,使用另一個軟體(例如spss),能自己計算這些矩陣,然後将資料輸入到amos或其它sem軟體中進行分析。例如,在一本雜志中發表文章,如果打算重新分析報告的協方差陣,這個功能就很有用。

然 而,通常使用行資料輸入作為首選的模型分析:研究者通過資料庫,也許是spss或其它通用格式(像微軟的excel ),給sem程式,計算協方差作為分析的一部分。如果資料庫沒有完整的資料,這些程式能夠做什麼?缺失資料問題的典型解決方法包括個案的列删 ,如果個案有一個或多個缺失資料,整個個案的記錄被删除;對删,兩變量相關系數隻有用到個案資料時才被計算。對删導緻資料庫中兩變量協方差或相關系數有不

同的樣本量。缺失資料另一個典型的處理技術是在變量的缺失資料處用變量的均值替代。

但是這些典型的缺失資料處理方法從統計觀點來看沒 有多少吸引力。列删導緻統計功效降低,特别是如果許多個案在多個變量上隻有幾個資料缺失,更不要說在資料庫中所有完全測量的個體限制統計推斷。對删在邊際 上比較好,但協方差或相關使用不同的樣本量的結果對模型拟合效果有很大的影響,有時包括不可能解。最後,均值替代在所替代的地方會收縮變量的方差,這不是

所期望的。這些方法最緻命的問題是假設缺失資料是完全随機缺失,實際情況常常不是這回事 (little & rubin, 1987)。

對 缺失資料研究者能做什麼?如果缺失資料個案的比例小,比如說小于或等于5%。列删可以接受 (roth, 1994)。當然,如果5%(或更小)的個案不是完全随機缺失,會導緻參數估計不一緻。另外,缺失資料專家 (例如,little 和rubin, 1987) 推薦在分析中使用極大似然估計方法, 該方法充分利用可使用的資料。在前面的缺失資料中,amos使用極大似然估計。

定義模型和因果關系的理論基礎

sem 模型永遠不能被接受;它們隻能不被拒絕。這導緻研究者臨時接受一個規定的模型。sem研究者承認在多數情況下拟合模型等價于他們自己暫時地接受模型。任何 模型可能是"正确"的,因為他們适合資料和首選模型。研究者盡力排除替選模型, 擴充替選解釋,但這不總是可能的。 是以,使用sem需要某些不确定,特别是在控制條件下沒有收集的截面資料。(其它通用模型也是如此,例如方差分析和多重回歸分析技術。)

因 為這個原因,sem軟體需要研究者明确地定義模型。拟合資料較好的模型隻能被暫時接受時,拟合資料不好的模型絕對被拒絕。例如,如果用10個調查項拟合單 因子驗證性因子分析模型,模型被拒絕,能确信單因子不能充分解釋項目的共享方差,一個有用的發現,特别是如果相信一個共有因子沒有足夠地解釋項目的共享方 差。假設運作單因子模型,然後在相同的10個項目上運作雙因子模型;前一個模型被拒絕但後一個模型沒有被拒絕。現在知道在測量項目中不止一個因素需要解釋

共享方差。

除了評估單個模型的絕對拟合優度外,也能通過使用比較似然比卡方檢驗評估競争模型。回到前面例子,能使用統計檢驗互相比較 單雙因子模型,如果統計檢驗顯著,能得出較複雜的雙因子模型比單因子模型拟合資料更好。另一方面,要是發現兩個模型間沒有顯著差别,能得出單因子模型與雙 因子模型拟合資料效果相同。

不是所有模型都可以用這種方法比較。隻有在較複雜的模型上利用一組限制或限制得出一個更簡單模型的模型才可以用這種方式比較。這些模型叫做嵌套模型。當想比較不能直接比較的模型時,能使用各種描述标準比較這些非嵌套模型。