天天看點

KS的計算和了解

ks 的計算很多時候能幫助我們更好的了解 該名額的深層次含義:

下圖來自知乎 風控模型—區分度評估名額(KS)深入了解應用

KS的計算和了解

上述計算過程中主要有兩個點不是特别的清晰, cum_bad_rate 和 cum_good_rate

其中 cum_bad_rate 就是目前以及目前之前區間的累計的 bad 數量相加,除全部的 bad 樣本數量,比如 (88+65) /342 = 44.74%, 相應的就是good的計算(在計算的時候我們是知道每個樣本的true label的,是以召回,準确等四宮格裡面的名額 都可以計算)

最後 觀察分箱中最大的 ks 值即為最終的KS值,此時也可以确定最佳的分割門檻值(相應的不同分箱以及分箱粒度會對最終的結果有影響)