天天看點

二進制logistic模型案例_綜合因素與定罪的二進制 Logistic 回歸分析

二進制logistic模型案例_綜合因素與定罪的二進制 Logistic 回歸分析

通過交叉分析與卡方檢驗已經得出 7 個自變量對于遺棄緻人死亡定罪具有顯著性影響, 但這些影響僅在考慮單個因素、不控制其他自變量的情境下,要了解綜合因素、控制其他因 素的情況下,自變量對于遺棄緻人死亡定罪是否有影響、影響程度如何,須将 7 個自變量納 入 Logistic 回歸模型進行分析。由于“是否故意殺人罪定罪”為二進制分類變量,遂采用二進制 Logistic 回歸分析。基于回 歸的假設前提,需将所有無序分類自變量轉換為啞變量,并選擇參照類别。參照類别設定如 下,遺棄對象之父母,遺棄地點之公共場所,遺棄時氣溫之未說明,遺棄行為程度之弱化 遺棄,遺棄次數、時長之多次、跨時,主觀方面之未說明,他人知悉、協調之未說明。在 SPSS 中,将因變量和 8 個自變量納入二進制 Logistic 回歸模型,8 個自變量均設定為分類變 量,并在參考類别中選擇“最後一個”,Exp(B)置信區間為 95%,自變量進入模型方法為 “輸入”(系統預設)。 一 回歸方程的拟合優度檢驗

通過樣本資料建立的回歸方程還不能直接用于實際問題分析和預測,通常要先通過各種 統計檢驗。欲利用回歸模型預測并獲得準确結論,回歸方程的拟合優度〔19〕須足夠高。線性 回歸方程的拟合優度主要看 R² 〔20〕,而對于二進制 Logistic 回歸方程來說,Cox and Snell 的 R² 和 Nagelkerke 的 R² 系僞 R²,其拟合程度檢驗主要為霍斯默 - 萊梅肖檢驗(Hosmer Lemeshow Test)。另外,也可通過分類表(Classification Table)〔21〕觀察方程的拟合程度,如果分類表顯 示的預測準确率高,反過來說明方程拟合程度好。

二進制logistic模型案例_綜合因素與定罪的二進制 Logistic 回歸分析
二進制logistic模型案例_綜合因素與定罪的二進制 Logistic 回歸分析

霍斯默 - 萊梅肖檢驗顯著性為 0.997,大于 0.05,說明回歸方程拟合程度極好,亦即二 元 Logistic 回歸模型能夠很好反映變量之間的關系。另外,從分類表可以看出,觀測值 Y=0 有 58 個,預測 57 個為 0,預測正确率為 98.3%;觀測值 Y=1 有 42 個,預測 39 個為 1,預 測正确率為 92.9%,總預測正确率為 96.0%,極高預測率也說明了二進制 Logistic 回歸模型與 觀測值的拟合程度極佳。

經檢驗,回歸方程的拟合優度極高,意味着回歸方程很好地反映因變量(是否以故意殺 人罪定罪)與自變量(遺棄對象、地點、氣溫、行為程度、遺棄時長、主觀方面、他人知悉 或協調)之間的關系,可以正确觀察何種因素對于認定故意殺人罪具有顯著性影響,也可用 以預測相關行為的定罪。

二 回歸系數解讀

解讀回歸系數,主要看顯著性 Sig(P 值)〔22〕、B 與 Exp(B)。顯著性 P 值越低越好,而 0.05 是一個通用的風險機率,即一般認為 P 小于 0.05 才有顯著影響。B 值是指回歸系數和 截距(常數項),回歸系數表示自變量 x 對因變量 y 影響大小的參數。B 越大表示 X 對 Y 影 響越大,正回歸系數表示 Y 随 X 增大而增大,負回歸系數表示 Y 随 X 增大而減小。一般情 況下,回歸系數 β 解釋為,當自變量 X 增加或減少一個機關時,平均來說,Y 增加或減少 β 個機關。Exp(B)是即優勢比、筆值比,即在其他條件不變的情況下,自變量每改變 1 個機關,事件發生比“odds”的變化率。odds 越大,事件發生的機率越大,且不發生的機率 越小。

二進制logistic模型案例_綜合因素與定罪的二進制 Logistic 回歸分析
二進制logistic模型案例_綜合因素與定罪的二進制 Logistic 回歸分析

關于與以故意殺人罪定罪具有顯著性的影響因素。X2(1)P=.033(<0.05),說明在 控制其他因素的情況下,遺棄地點為偏僻、隐蔽處對于遺棄緻人死亡定罪具有顯著性影 響;B=3.081,說明地點為偏僻、隐蔽處與遺棄緻人死亡被認定為故意殺人罪為正相關關系;B=3.081>0.05,Exp(B)=21.778,說明遺棄地點為偏僻、隐蔽處的情形被認定為故意殺人罪 顯著高于遺棄地點為公共場所(參考類别為“最後一個”,遺棄地點為公共場所)的情形。X4(1)P=.028(<0.05),B=3.606,說明遺棄時天氣惡劣與遺棄緻人死亡被認定為故意殺人 罪具有顯著的正向影響;Exp(B)=36.810,說明遺棄時天氣惡劣的情形被認定為故意殺人 罪顯著高于未說明遺棄時氣溫的情形。X7(1)P=.003(<0.05),B=4.284,說明明知會發生 的情形與遺棄緻人死亡被認定為故意殺人罪具有顯著的正向影響;Exp(B)=72.552,說明 明知會發生的情形被認定為故意殺人罪顯著高于未說明主觀方面的情形。

關于與以故意殺人罪定罪不具有顯著性的影響因素。關于 X1 遺棄對象,整體顯著性 P=1.000(>0.05),說明在控制其他因素的情況下,遺棄對象對于遺棄緻人死亡定罪不具有 顯著性影響;X1(1)P=.997(>0.05);遺棄對象為嬰幼兒的情形被認定為故意殺人罪并不 顯著高于遺棄對象為夫妻的情形,X1(2)P=.999(>0.05),說明遺棄對象為父母的情形被 認定為故意殺人罪并不顯著高于遺棄對象為夫妻的情形。X2(2)P=.997(>0.05),說明遺 棄地點為私人領域的情形被認定為故意殺人罪并不顯著高于遺棄地點為公共場所的情形。關 于 X5 遺棄行為程度,X5P=1.000,說明遺棄行為程度對于遺棄緻人死亡定罪不具有顯著性 影響;X5(1)P=.996,說明強化遺棄情形被認定為故意殺人罪并不顯著高于弱化遺棄情形, X5(2)的顯著性 P=.998(>0.05),說明純粹遺棄情形被認定為故意殺人罪并不顯著高于弱 化遺棄情形。X6(1)P=1.000(>0.05),說明遺棄為單次、短時情形被認定為故意殺人罪并 不顯著高于遺棄為多次、跨時的情形。X7(2)P=.998(>0.05),說明希望被救助被認定為 故意殺人罪并不顯著高于未說明主觀方面的情形。X8(1)P=1.000(>0.05),說明他人知悉、 協調的情形被認定為故意殺人罪并不顯著高于他人未知悉、協調的情形。

綜上,在綜合因素、在控制其他因素的情形下,遺棄對象、行為程度、遺棄次數及時長、 他人是否知悉或協調對于以故意殺人罪定罪不具有顯著性影響。遺棄地點、天氣、主觀方面 對于以故意殺人罪定罪具有顯著性影響,确切地說,遺棄地點為偏僻或隐蔽處、遺棄時天氣 惡劣、明知會發生死亡結果對于遺棄緻人死亡被認定為故意殺人罪具有顯著的正向影響。

三 回歸方程對樣本的預測與預測值

根據系統預設,以 0.5 為切割值,預測機率大于 0.5 的,說明預測為“以故意殺人罪定罪”的機率比較大,預測機率小于 0.5 的,說明預測為“以故意殺人罪定罪”的機率比較 小。根據模型預測結果圖,預測分布的數值基在大于 0.5 為切割值中,絕大多是為“1”,表 示絕大多數為故意殺人罪,預測機率很準确,在小于 0.5 為切割值中,絕大多是為“0”表 示絕大多數為遺棄罪,預測機率也很準确。

二進制logistic模型案例_綜合因素與定罪的二進制 Logistic 回歸分析

從資料表的預測值來看,在認定為故意殺人罪的判決中,有 16 例的預測值 PRE=1,預 測類别為“1”,意味着這些案例中的相關行為根據以往經驗數值被認定為故意殺人罪機率 為 100%。有 12 例的預測值 PRE=0.99863,有 1 例的預測值 PRE=0.97106,有 8 例的預測值 PRE=0.95205,有 3 例的預測值 PRE=0.90969,預測均為類别“1”。該 39 個判決 PRE 預測概 率遠遠大于 0.5,說明這些案例中的相關行為預測被認定為故意殺人罪機率極高。為了直覺 地了解遺棄緻人死亡在何種情況下被認定為故意殺人罪,以下将回歸模型預測地結果類型化。

二進制logistic模型案例_綜合因素與定罪的二進制 Logistic 回歸分析

在認定為遺棄罪判決,有 31 例的預測值 PRE=0,預測類别“0”,意味着這些案 例中的相關行為根據以往經驗數值被認定為故意殺人罪機率為 0%。有 19 例的預測值 PRE=0.01241,有 6 例的預測值 PRE=0.21486,有 1 例的預測值 PRE=0.31626,上述判決 PRE 預測機率遠遠小于 0.5,說明這些案例中的相關行為預測被認定為故意殺人罪機率極低。

〔19〕回歸方程的拟合優度檢驗是指檢驗樣本資料點聚集在回歸線周邊的密集程度,進而評價回歸方程對樣本資料的代表程度。參見薛薇:《統計分析與 SPSS 的應用》,中國人民大學出版社 2017 年版,第 231 頁。 〔20〕決定系數 R2 是一個反映回歸直線與樣本觀測值拟合優度的相對名額,是因變量的變異中能用自變量解釋的比例。其數值在 0-1 之間,R2 接近 1,說明因變量不确定性的絕大部分系數能有回歸方程解釋,回歸方程拟合度好。參見何曉群、劉文卿:《應用回歸分析》,中國人民大學出版社 2019 年版,第 36 頁。 〔21〕根據 Logistic 回歸模型,對樣本重新判别分類,符合率越高,模型拟合越好。 〔22〕P 值就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的機率。如果 P 值很小,說明原假設情況的發生的機率很小,而如果出現了,根據小機率原理,就有理由拒絕原假設,P 值越小,拒絕原假設的理由越充分。0.05 則是一個通用的風險機率。參見賈俊平等:《統計學》,中國人民大學出版社 2018 年版,第160-161 頁。

二進制logistic模型案例_綜合因素與定罪的二進制 Logistic 回歸分析