天天看點

申請評分模型拒絕推斷(RI)方法申請評分模型拒絕推斷(RI)方法

申請評分模型拒絕推斷(RI)方法

文章目錄

  • 申請評分模型拒絕推斷(RI)方法
    • 1、拒絕推斷評分卡模組化流程
    • 2、拒絕推斷的方法彙總(簡化版)
      • 1、Simple Assignment(配置設定指派法)
      • 2、Augmentation
        • 2.1、Simple augmentation (Hard-cutoff,簡單擴充法)
        • 2.2、Fuzzy augmentation (模糊擴充法)
        • 2.3、Parcelling(分段擴充法)

1、拒絕推斷評分卡模組化流程

The workflow for the reject inference process is:

申請評分模型拒絕推斷(RI)方法申請評分模型拒絕推斷(RI)方法
  1. Build a logistic regression model based on the accepts. (bases_model)
  2. Infer the class of rejects using one of the reject inference techniques.
  3. Combine the accepts and rejects into a single data set.
  4. Create a new scorecard, bin the expanded data set, and build a new logistic model.(final_model)
  5. Validate the final model.

2、拒絕推斷的方法彙總(簡化版)

拒絕推斷是對一種非随機性缺失(MNAR)的資料處理形式,概況來說有兩種處理技術:配置設定法和增強法。這兩種方法,一種依賴經驗,一種依賴算法:

申請評分模型拒絕推斷(RI)方法申請評分模型拒絕推斷(RI)方法

在一些機構當中,為了較準确推斷出拒絕樣本中的好壞分布,會采用下探法。也就是說在生産環境中某一段時間内,接受所有申請,積累全量客戶(但被規則拒絕的仍然會被拒絕),或者将模型評分cutoff value下移,讓更多的的申請通過。待該批客戶有了貸後表現後選擇全量樣本進行模組化。這種通過放松拒絕比準的下探法需要機構承受較大的壞賬損失,通過增加壞賬成本擷取更多資料。 實際生産環境表明,增量下探方法對改善模型的效果比較明顯。

1、Simple Assignment(配置設定指派法)

指派法是指通過查詢拒絕樣本的外部貸款資料或人工的方法,為拒絕樣本打上好壞标簽。如果發現拒絕客戶在其他機構發生違約行為或被打上各種風險标簽,則通過規則直接對客戶進行好壞樣本标記。如果資料采集的成本不高,采集難度不大,這種方法可行且有效。

2、Augmentation

2.1、Simple augmentation (Hard-cutoff,簡單擴充法)

Hard-cutoff方法首先是使用有貸後表現的通過樣本訓練出來base_model,然後對拒絕樣本進行打分。拒絕樣本因為沒有真實的貸後表現,隻能人為賦予“good”或者“bad”的标簽。通常情況下我們假定拒絕樣本中的bad rate是通過樣本的2-5倍,以此來确定cutoff value。對評分比cutoff value要差拒絕樣本,我們标記這部分樣本為壞樣本。對評分比cutoff value好的拒絕樣本,我們标記為好樣本。然後将有了好壞标記的拒絕樣本重新放回到樣本集中,與通過樣本一起重新訓練一個模型,我們記做final_model。(另一種做法是:得出的模型重新對拒絕樣本評分,并調整cutoff value,重新訓練final_model,重複前面的流程,直至模型參數收斂。)

2.2、Fuzzy augmentation (模糊擴充法)

Fuzzy augmentation方法與Hard-cutoff方法相同的地方都是先将base_model應用在拒絕樣本。不同之處是每個樣本都複制成兩個樣本,其中一個标記為壞樣本,有對應的壞的機率,另一個标記為好,有對應的好的機率。這兩個好與壞的複制樣本重新放回并入到通過樣本集中,好壞機率作為這兩個複制樣本的權重,重新訓練一版模型,得到final_model。

2.3、Parcelling(分段擴充法)

分段擴充法是先在有貸後表現的樣本上模組化,然後分别為通過樣本和拒絕樣本打分,并劃分成适當的分數段(譬如說,20個分數段)。接下來,按照各分數段對拒絕樣本打上好壞樣本标簽。一般來說,拒絕樣本的違約率要高于通過樣本的違約率,可以假定同一分數段内拒絕樣本的違約率是通過樣本的2-5倍。分段之後,按照簡單擴充法中的做法繼續進行。将打好标簽的拒絕樣本和通過樣本重新放在一起模組化,重複以上步驟直至模型參數收斂。

申請評分模型拒絕推斷(RI)方法申請評分模型拒絕推斷(RI)方法