![](https://img.laitimes.com/img/_0nNw4CM6IyYiwiM6ICdiwiIyVGduV2YfNWawNCM38FdsYkRGZkRG9lcvx2bjxiNx8VZ6l2cs0TPR9ENRRUT3VERPpHOsJGcohVYsR2MMBjVtJWd0ckW65UbM5WOHJWa5kHT20ESjBjUIF2X0hXZ0xCMx81dvRWYoNHLrdEZwZ1Rh5WNXp1bwNjW1ZUba9VZwlHdssmch1mclRXY39CXldWYtlWPzNXZj9mcw1ycz9WL49zZwpmLygzNzEDN1UTM3IDMxAjMwIzLc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.jpg)
網上搜到的資料都缺思維步驟,是以自己總結資料寫了一個。
其中需要注意幾點:
1、woe轉換之後的資料是lr分類的輸入。
2、lr分類結果沒用,用的是内部拟合線的各個變量的各個系數。
3、認為上述拟合的線的結果是odd。
4、認為odd和最終分數符合圖中第五步的式子。
5、第四步可以了解為,設定兩組“odd和想要的對應分數”,算出公式中的某些參數。
6、lr分類結果的作用是判斷這個預測任務是否能預測,在能預測的情況下各個系數β才能用。
7、很多資料顯示除了woe還要算iv,iv是用來判斷這個特征次元是否可用。
8、确定幾率翻倍的分數(PDO,Point-to-Double Odds)。
9、θ的定義
這兩個截圖來源于:https://blog.csdn.net/huobanjishijian/article/details/51611860
有用請點贊,歡迎指正!