看到研習社有夥伴提問:
①我們的評分卡做好後,後續的使用政策是什麼呀,都有哪些方向?
②評分卡分數切割點如何定,制定的業務邏輯是什麼?
其實,這個問題不好回答,也好回答。
一方面,不好回答是因為金融市場分級明顯,産品多樣化,不同業務場景所需要的風控政策就對應不同,不太好理一套完整的、通用的、标準的說明書;另外,許多部門制定評分卡切分點的政策都是根據經驗拍腦袋(我們後面說明)。
另一方面,好回答的原因是金融借貸業務本質相同,核心名額就幾個,針對這些業務名額,我們還是可以找到許多通用的評分卡應用流程及大緻方案的。
下面,我們就來解決三個問題:
①常見評分卡有哪幾種形式?
②業務中評分卡的cutoff值該如何設定?
③開發出的評分卡,可以應用于信貸産品的哪些方面?
首先,我們回顧下标準評分卡開發流程:
圖一:評分卡模型開發流程(圖檔取材于網絡)
圖二:标準logistic回歸模型開發流程(圖檔取材于網絡)
想必小夥伴對模型開發的這套流程已了熟于胸,我們不再綴述。主要來看看使用不同算法得到的結果有哪些?得到的違約機率預測值又是怎麼轉換為标準score形式的。
一、常見評分卡有哪幾種形式?
1)刻度評分卡
①來回顧下logistic函數表達式:
邏輯回歸(logistic regression)通過 s i g m o i d sigmoid sigmoid函數 y = 1 / ( 1 + e − z ) y = 1/(1+e^{-z}) y=1/(1+e−z) 将線性回歸模型 z = ω T x + b z = \omega ^{T}x+b z=ωTx+b 産生的預測值轉換為一個接近0或1的拟合值 y ^ y\hat{} y^
y ^ = 1 1 + e − z y\hat{} = \frac{1}{1+e^{-z}} y^=1+e−z1 = 1 1 + e − ( ω T x + b ) = \frac{1}{1+e^{-(\omega ^{T}x+b)}} =1+e−(ωTx+b)1
上式的 y ^ y\hat{} y^ 可視為事件發生的機率 p ( y = 1 ∣ x ) p(y = 1|x) p(y=1∣x) ,變換後得到:
l n p 1 − p = z = ω T x + b ln\frac{p}{1-p}=z=\omega ^{T}x+b ln1−pp=z=ωTx+b
其中 p 1 − p \frac{p}{1-p} 1−pp 為比率 ( o d d s ) (odds) (odds),即違約機率與正常機率的比值。 l n p 1 − p ln\frac{p}{1-p} ln1−pp 為 l o g i t logit logit 函數,即比率的自然對數。是以,邏輯回歸實際上是用比率的自然對數作為因變量的線性回歸模型。
l n ( o d d s ) = ω T x + b ln(odds) =\omega ^{T}x+b ln(odds)=ωTx+b
(涉及算法詳細推導過程這裡不再贅述)
②評分卡設定的分值刻度可以通過将分值表示為比率對數的線性表達式來定義,即可表示為下式:
s c o r e = A − B l n ( o d d s ) score = A − Bln(odds) score=A−Bln(odds)
其中,A和B是常數。式中的負号可以使得違約機率越低,得分越高。通常情況下,這是分值的理想變動方向,即高分值代表低風險,低分值代表高風險。
常數A和B的值可以通過兩個假設代入上式計算得到:
通常,我們設當壞好比相同時,基準壞好比率 ( o d d s 0 ) (odds0) (odds0)對應的基準分值 ( p o i n t s 0 ) (points0) (points0)為:
p o i n t s 0 = A − B l n ( o d d s ) points0 = A - Bln(odds) points0=A−Bln(odds)
當壞好比翻倍時,對應的分數 P D O ( P o i n t s t o D o u b l e t h e O d d s ) PDO(Points to Double the Odds) PDO(PointstoDoubletheOdds)為:
p o i n t s 0 − P D O = A − B l n ( 2 o d d s ) points0 - PDO = A - Bln(2odds) points0−PDO=A−Bln(2odds)
聯立兩方程,可以得到:
B = P D O / l n ( 2 ) B = PDO/ln(2) B=PDO/ln(2)
A = p o i n t s 0 + B l n ( o d d s ) A = points0 + Bln(odds) A=points0+Bln(odds)
假設設定評分卡刻度使得比率為{1:1}(違約正常比)時的分值為50分,PDO為10分,代入式中求得:B=14.43,A=6.78
則分值的計算公式可表示為:
S c o r e = 6.78 − 14.43 l o g ( o d d s ) Score = 6.78 - 14.43log(odds) Score=6.78−14.43log(odds)
③分值配置設定。将邏輯回歸公式代入評分卡分值公式,可以得到:
s c o r e = A − B l n ( o d d s ) = A − B ( ω T + b ) = ( A − B b ) − B ω 1 x 1 − B ω 2 x 2 ⋯ − B ω m x m score = A − Bln(odds) = A − B(\omega _{T}+ b) = (A − Bb)− B\omega _{1}x_{1} − B\omega _{2}x_{2} ⋯− B\omega _{m}x_{m} score=A−Bln(odds)=A−B(ωT+b)=(A−Bb)−Bω1x1−Bω2x2⋯−Bωmxm
其中, ω 1 . . . ω x \omega _{1}...\omega _{x} ω1...ωx為最終進入模型的自變量且已經轉換為WOE值, ω i \omega _{i} ωi為邏輯回歸的變量系數, b b b為邏輯回歸的截距, A , B A,B A,B為上頁求得的刻度因子。 B ω i x i B\omega _{i}x_{i} Bωixi為變量 x i x_{i} xi對應的評分, ( A − B b ) (A−Bb) (A−Bb)為基礎分也可将基礎分值平均配置設定給各個變量。
這樣,我們就可以得到如下圖或者如圖二中标準刻度評分卡的樣式,對應的score便可根據公式順利求出。(下圖資料非真實資料)
2)機率評分卡
L O G I S T LOGIST LOGIST函數的特點就在于可以将事件發生的機率P限制在0~1區間,本質上也是對線性回歸或者其他算法模型做的一種對數轉換。
那麼,在無法實作标準評分轉換的情況下,我們可以直接将機率預測值線性限制到我們想要的評分區間:
s c o r e = A − B ∗ P ( 1 ) score = A-B*P(1) score=A−B∗P(1)
效果如下圖:
3)兩種評分卡形式的優點:
兩種方法本質上沒有差別,隻是劃分的區間不同。
1)刻度評分卡:
①可解釋性強,建構邏輯符合業務邏輯
②可根據業務進行特征權值的調整
2)機率評分卡:
①易于了解
①計算簡便
注: 為了友善業務了解和使用,通常,我們會将評分卡的分數基于某種數學轉換方式限制到一個完整的區間(cutoff),如:300~850,具體根據業務需求和偏好制定。
二、業務中評分卡的cutoff值如何定?
如下圖,得到score之後,我們就有了一份完整的貸後評分資料,包括label字段和score字段。那麼,如何切分cutoff呢,哪部分使用者拒絕,哪部分使用者通過,怎麼确定呢?我們需要用到幾個業務名額:
①分箱違約率
①累計違約率
②累計通過率
③綜合盈利
大緻思路為:把分數降序排列分為一百段,按1%的通過率遞增,(或者50段,20段,15段,因樣本量和區分度等需求拟定),根據分箱違約率、累計違約率、累計通過率、綜合盈利的綜合考量,決定業務中比較合适的評分卡cutoff值。
如下示例(非真實資料):
我們可以看到,因為放款成本的問題,如果分數卡太高,絕對虧損。在cutoff卡在527分以上的時候,通過率為60%,此時累計壞賬率為9.63%,扭虧為盈。如果分數降低點,壞賬依舊可控,那分數卡的越低,通過率越高,盈利就越多。不過,随着分數的降低,壞賬比增高,升到一定程度,扭赢為虧。
那麼為了保持盈利,我們就需要找最優盈利下的那個cutoff值。(一般綜合盈利需要财務部、風險部、營運部協同生産)
在有貸後資料的基礎上,業務中的評分卡門檻值就是這樣産生的。
當然,很多産品上線初期沒有足夠的貸後資料,那麼就可以根據行業标準去推斷這個門檻值。比如先去調研當下行業整體針對不同産品、不同管道的通過率、壞賬率大概是多少,然後計算綜合成本,最後看下要求滿足的通過率所對應的評分卡門檻值為多少,那麼就可以以那個值為标準去做業務,後期持續優化。另外,評分卡門檻值的制定,不單純看資料,經驗也很重要,比如:老闆看好接下來的市場,也可以提高通過率,雖然意味着高壞賬的發生,但也許對應着更高的利潤。
我們也可以将評分卡劃分更多的意義區間,如:
①低風險、中風險、高風險
②A/B/C/D/E
分别用于風險授信、額度設計、精細化管理等業務中。
3)開發出的評分卡,可以應用于信貸産品的哪些方面?
評分模型可應用于貸前客戶引流、審批、授信,貸中客戶精細化管理、違約預警,貸後催收響應等環節。
• 風險控制的重要工具
• 申請評分卡用于信用風險評價
• 行為評分卡用于提前預警、額度管理
• 催收評分卡用于優化催收策
我們可以根據信用周期的需求,開發多種評分模型:
客戶篩選評分模型
① 篩選白名單客群
② 提高審批通過率
貸前-申請信用評分模型
① 預測客戶違約機率
② 應用于準入、額度制定、
貸中-行為評分模型
① 提前預警
② 額度管理
③ 精細化管理
貸後-催收評分模型
① 優化催收政策
② 優化催收人力配置設定
③ 優化催收力度調節
三、總結
- 今天,我們針對多數同學感興趣的評分卡門檻值設定,做了幾點介紹,主要成果如下:
- ① 評分卡的兩種方式
- ② 業務中如何切分評分卡門檻值
- ③ 評分卡在信貸領域的多種應用場景
- ④ 小夥伴們如果還有其他補充,歡迎評論,或者在公衆号留言。
四、番外
對資料分析、機器學習、資料科學、金融風控等感興趣的小夥伴,需要資料集、代碼、行業報告等各類學習資料,可添加微信:wu805686220(記得要備注喔!),也可關注微信公衆号:風控圏子(别打錯字,是圏子,不是圈子,算了直接複制吧!)
關注公衆号後,可聯系圈子助手加入如下社群:
- 機器學習風控讨論群(微信群)
- 反欺詐讨論群(微信群)
- python學習交流群(微信群)
- 研習社資料(qq群:102755159)(幹貨、資料、項目、代碼、報告、課件)
互相學習,共同成長。