天天看點

Scorecard 評分卡模型

公式
Scorecard 評分卡模型
woe=ln(odds),beita為回歸系數,altha為截距,n為變量個數,offset為偏移量(視風險偏好而定),比例因子factor。
Scorecard 評分卡模型

總評分。或去掉負号。

Logistic Regression with Weight of Evidence

比例因子和偏移量為:

令好壞比為50,對應的評分為600;在些基礎上評分值增加20分,e.g.

600 = log(50) * factor + offset

620 = log(100) * factor + offset

Factor = 20 / log(2)

Offset = 600 – factor * log(50)

WoE Weight of Evidence 證據權重
Scorecard 評分卡模型
其中,
Scorecard 評分卡模型

,odds為好壞比,即WOE=ln(odds)

e.g.

Scorecard 評分卡模型

ID是自變量,有A1/A2/A3三個取值;因變量有1和0兩種取值,相對應的是樣本數量(如 Y=1|ID=A1 的樣本數是10)。當自變量取值Ai時,編碼為相應的WOEi。

Odds = 1, WoE = 0; Odds > 1, Pgood > Pbad, WoE > 0.

WoE值越高,說明這個分組的風險機率越低。(前提:good attribute 作分子。WoE可少于零)

IV Information Value 資訊價值
Scorecard 評分卡模型

相當于自變量WOE值的一個權重求和,其值的大小決定了自變量對于目标變量的影響程度(與資訊熵的公式稍似)。

一般應大于0.02,預設選IV大于0.1的變量進模型,但具體要結合實際。如果IV大于0.5,就是過預測(over-predicting)變量。

Information Value Predictive Power
< 0.02 useless for prediction
0.02 to 0.1 Weak predictor
0.1 to 0.3 Medium predictor
0.3 to 0.5 Strong predictor
>0.5 too good to be true
ROC/AUC

ROC曲線、受試者工作特征曲線、感受性曲線(receiver operating characteristic curve),用于二分問題。

判别:(1)ROC曲線越靠近左上角,試驗的準确性就越高;(2)或算出線下面積(AUC, Area Under Curve)比較,AUC最大,則最佳。

AUC在 0.5~0.7時有較低準确性, 0.7~0.8時有一定準确性, 0.8~0.9則高,AUC在0.9以上時有非常高準确性。AUC=0.5時,說明診斷方法完全不起作用,無診斷價值。AUC<0.5不符合真實情況,在實際中極少出現。

GINI 見“CART”-“GINI指數”
分組

Segmentation 模型分組

将總體劃分為幾個子總體,然後對不同的子總體分别建立評分卡。視需要而是否使用。

binning

Binning means the process of transforming a numeric characteristic into a categorical one as well as re-grouping and consolidating categorical characteristics.

等距、等頻、按需、優化離散(常用的檢驗名額有卡方,資訊增益,基尼指數,或WOE)

Cutoff

Cutoff臨界分值

若申請人的信用得分在該分數上,則評分系統建議準許申請;反之。

選擇方法:(1)申請準許比率與模型使用前的比率一緻;(2)壞帳率與模型使用前的比率一緻;

Scorecard 評分卡模型
人工修正

HSOs高端人工修正:超過臨界值,但仍然不通過申請;

LSOs低端人工修正:反之。

屬性 Attribute 如次元“性别”有兩個屬性:“男”、“女”
權重 Score weight如未婚15分、已婚30分
拒絕推斷

Reject Inference

一般來說,信用評分的訓練樣本均來自于以前申請貸款被接受的那些人,而評分模型則是要應用到所有申請的人,是以如直接應用模型到被拒絕者,很有可能會出現問題。

Reject Inference對模型修正來解決這個問題。

模型驗證

Validation

留下一部分樣本做最後的驗證。

PSI

穩定度分析名額

PSI衡量兩組樣本評分是否有顯著差異。

公式:

Scorecard 評分卡模型
判斷:index <= 0.1,無差異;0.1< index <= 0.25,需進一步判斷;0.25 <= index,有顯著位移,模型需調整。
LTV

LTV 貸放成數 Loan to Value

貸款額與抵押價值的比率,用于額度管理,如:

評分分級 最高貸放成數LTV
A 85%
B 75%
個人信用評分>=80,且LTV<=85,接受貸款;否則反之。

例子

Scorecard 評分卡模型

* 參考:

http://wenku.baidu.com/link?url=r-_I14SKnUuYhWFqADQlN6L1W8cMZbb1IE7OTAkJ7xBTuCtMF-e3hw4m1LwQmcJJhusFj3iELxy7dwvgrZxD-yKHFmAKdO0J-ruvEQBiAWq

http://wenku.baidu.com/link?url=5o-HqJfpMpAkqrHYhYMWTA3eNU41Z181-OQqN_ZRpalOTxC3gE9cVsCahqk3pWnyTi9LL2NQhc8opoyQibaY1DQKziXJybywI3XVve3IWsK

申請評分卡在小額貸款公司營運管理中的應用_吳敏

http://plug-n-score.com/learning/scorecard-development-stages.htm

繼續閱讀