天天看點

Logistic回歸簡介和相關的PYTHON實作

        在資料模組化過程中,就有機器學習的監督學習而言,通常會有一個目标變量(因變量)和若幹個可能會對目标變量産生影響的變量(自變量),選用一個模型,結合訓練資料集(XY已知)進行訓練拟合,再用模型去進行預測。在模型的選擇中,Y的分布類型可能會對模型的性質産生影響,通常情況下,因變量Y為正态分布的數值型變量時,采用的是回歸預測方式,如線性回歸等;因變量Y為貝努利分布的類别變量時,所采用的模型應該是一個分類器,而Logistic回歸就是其中之一。

Logistic回歸介紹:

        二分類問題的Logistic模型的基本形式如下:

Logistic回歸簡介和相關的PYTHON實作

       因變量Y可能屬于0或者1兩個類别,n為自變量的數量,輸出的結果為Y屬于1類的機率,機率值P隻能介于0和1之間,當P越接近于1,則說明Y越可能屬于1類,否則,Y就越可能屬于0類。

       就邏輯曲線的形狀特征而言,越遠離曲線的中心點(自然對樹的指數結果為0,P等于0.5),