天天看點

淺談最廣泛應用的金融風控算法-評分卡背景評分卡模型解釋性評分卡流程

背景

信用是一切社會金融體系的根本,有了每個人的信用我們才可以進行放貸、共享充電寶、共享單車等業務。如果可以準确的給每個社會成員的信用做一個打分,将對金融業務的推進有很大作用,很多相關業務的企業也在探索如何實作信用分。

淺談最廣泛應用的金融風控算法-評分卡背景評分卡模型解釋性評分卡流程

目前業内最通用的方案是評分卡算法,這個算法底層其實就是簡單地二分類模型,将邏輯回歸或者xgboost進行封裝。但是為什麼不能直接使用xgboost甚至深度學習算法做信用評估呢?因為金融業務有自己的特殊性,要求模型需要有強解釋性,是以評分卡解決方案經常包含分箱和評分兩個子產品。就是為了做到每個分數的強解釋性。

評分卡模型解釋性

通過一個例子介紹什麼叫強解釋性。以下圖為例:

淺談最廣泛應用的金融風控算法-評分卡背景評分卡模型解釋性評分卡流程

這是一個評分卡算法的部分特征資料展示,有年齡、性别、婚姻狀況、學曆、月收入。評判每個人的分數也很容易:

客戶分=基準分+年齡分+性别分+婚姻狀況分+學曆分+月收入分

是以在評分卡體系中,每個人的分數都會拆分成很多子子產品,這些子子產品的分數的和,跟基準分加到一起就是信用評分。接下來介紹下評分卡的執行流程。

評分卡流程

1.資料準備

淺談最廣泛應用的金融風控算法-評分卡背景評分卡模型解釋性評分卡流程

通常評分卡模型的資料需要包含四個方面,分别是客戶統計資訊、賬戶屬性、消費行為和還款行為。

根據資料目标的不同,可以分為ABC三種評分卡:

  • 貸前:申請評分卡(Application score card),又稱為A卡
  • 貸中:行為評分卡(Behavior score card),又稱為B卡
  • 貸後:催收評分卡(Collection score card),又稱為C卡

2.分箱

分箱算法是将每個字段按照不同的模式進行離散化處理。分箱有很多模式,分為有監督模式和無監督模式。

  • 有監督分箱:通過訓練二叉樹模型,将IV大的切分點找出來實作分箱
  • 無監督分箱:利用等頻、等距等模式進行分箱

分箱出來的分箱結果需要進行評估,并且不斷調整分箱。評估方式是要計算WOE和IV名額。

淺談最廣泛應用的金融風控算法-評分卡背景評分卡模型解釋性評分卡流程

WOE指的是該組好的客戶和所有好的客戶的比例,WOE的值最終會影響IV的值,IV的公式:

淺談最廣泛應用的金融風控算法-評分卡背景評分卡模型解釋性評分卡流程

IV的值越大,說明這個分箱模式對結果的預測越重要,是以分箱的目的是盡可能的提升每組分箱結果的IV值。

淺談最廣泛應用的金融風控算法-評分卡背景評分卡模型解釋性評分卡流程

通常分箱算法會提供一個WOE和IV的展示圖:

淺談最廣泛應用的金融風控算法-評分卡背景評分卡模型解釋性評分卡流程

3.評分算法

評分算法相對就比較簡單,其實就是訓練一個邏輯回歸或者XGboost模型,将模型系數跟對應的分箱的WOE值做權重。

淺談最廣泛應用的金融風控算法-評分卡背景評分卡模型解釋性評分卡流程

其中A是個基準分,B為常量,模型系數和WOE值組合成了剩下的變量和。最終通過評分算法将每個人的分數映射到一個合理的區間,是以評分區間的設定主要是調整A的取值,比如我們希望每個人的信用分都是500左右,就可以把A調整為500。最終的評分卡方案就是分箱+打分模型。

參考文獻:

[1]https://zhuanlan.zhihu.com/p/36539125

[2]https://blog.csdn.net/ISMedal/article/details/89380396

[3]https://www.jianshu.com/p/c3fa53c54cca

繼續閱讀