天天看点

申请评分模型拒绝推断(RI)方法申请评分模型拒绝推断(RI)方法

申请评分模型拒绝推断(RI)方法

文章目录

  • 申请评分模型拒绝推断(RI)方法
    • 1、拒绝推断评分卡建模流程
    • 2、拒绝推断的方法汇总(简化版)
      • 1、Simple Assignment(分配赋值法)
      • 2、Augmentation
        • 2.1、Simple augmentation (Hard-cutoff,简单扩展法)
        • 2.2、Fuzzy augmentation (模糊扩展法)
        • 2.3、Parcelling(分段扩展法)

1、拒绝推断评分卡建模流程

The workflow for the reject inference process is:

申请评分模型拒绝推断(RI)方法申请评分模型拒绝推断(RI)方法
  1. Build a logistic regression model based on the accepts. (bases_model)
  2. Infer the class of rejects using one of the reject inference techniques.
  3. Combine the accepts and rejects into a single data set.
  4. Create a new scorecard, bin the expanded data set, and build a new logistic model.(final_model)
  5. Validate the final model.

2、拒绝推断的方法汇总(简化版)

拒绝推断是对一种非随机性缺失(MNAR)的数据处理形式,概况来说有两种处理技术:分配法和增强法。这两种方法,一种依赖经验,一种依赖算法:

申请评分模型拒绝推断(RI)方法申请评分模型拒绝推断(RI)方法

在一些机构当中,为了较准确推断出拒绝样本中的好坏分布,会采用下探法。也就是说在生产环境中某一段时间内,接受所有申请,积累全量客户(但被规则拒绝的仍然会被拒绝),或者将模型评分cutoff value下移,让更多的的申请通过。待该批客户有了贷后表现后选择全量样本进行建模。这种通过放松拒绝比准的下探法需要机构承受较大的坏账损失,通过增加坏账成本获取更多数据。 实际生产环境表明,增量下探方法对改善模型的效果比较明显。

1、Simple Assignment(分配赋值法)

赋值法是指通过查询拒绝样本的外部贷款数据或人工的方法,为拒绝样本打上好坏标签。如果发现拒绝客户在其他机构发生违约行为或被打上各种风险标签,则通过规则直接对客户进行好坏样本标记。如果数据采集的成本不高,采集难度不大,这种方法可行且有效。

2、Augmentation

2.1、Simple augmentation (Hard-cutoff,简单扩展法)

Hard-cutoff方法首先是使用有贷后表现的通过样本训练出来base_model,然后对拒绝样本进行打分。拒绝样本因为没有真实的贷后表现,只能人为赋予“good”或者“bad”的标签。通常情况下我们假定拒绝样本中的bad rate是通过样本的2-5倍,以此来确定cutoff value。对评分比cutoff value要差拒绝样本,我们标记这部分样本为坏样本。对评分比cutoff value好的拒绝样本,我们标记为好样本。然后将有了好坏标记的拒绝样本重新放回到样本集中,与通过样本一起重新训练一个模型,我们记做final_model。(另一种做法是:得出的模型重新对拒绝样本评分,并调整cutoff value,重新训练final_model,重复前面的流程,直至模型参数收敛。)

2.2、Fuzzy augmentation (模糊扩展法)

Fuzzy augmentation方法与Hard-cutoff方法相同的地方都是先将base_model应用在拒绝样本。不同之处是每个样本都复制成两个样本,其中一个标记为坏样本,有对应的坏的概率,另一个标记为好,有对应的好的概率。这两个好与坏的复制样本重新放回并入到通过样本集中,好坏概率作为这两个复制样本的权重,重新训练一版模型,得到final_model。

2.3、Parcelling(分段扩展法)

分段扩展法是先在有贷后表现的样本上建模,然后分别为通过样本和拒绝样本打分,并划分成适当的分数段(譬如说,20个分数段)。接下来,按照各分数段对拒绝样本打上好坏样本标签。一般来说,拒绝样本的违约率要高于通过样本的违约率,可以假定同一分数段内拒绝样本的违约率是通过样本的2-5倍。分段之后,按照简单扩展法中的做法继续进行。将打好标签的拒绝样本和通过样本重新放在一起建模,重复以上步骤直至模型参数收敛。

申请评分模型拒绝推断(RI)方法申请评分模型拒绝推断(RI)方法