天天看點

中小微企業中的營業額與收入評估的風險模型預測

作者:番茄風控大資料宣

在中小微企業風控場景中,較為幾個重要的模型開發包括有企業營業額預測模型與還款能力模型(信用評估)。這兩大模型,可以類比于個人零售信貸場景中的收入評估與信用能力預測模型,算是在中小微風控中較為核心的兩大風險次元評估。以下我們來談一下。

一.經營能力預測

1.1.經營能力預測,其整體的模組化思路,可以參考大概的步驟有:

①利用企業過去三年的營業額來預測未來12個月的營業額

②多模型效果校驗,讓實際資料來選擇最優模型

③自動化疊代優化過程,充分利用人工智能來實作全線上和全程自動化

④定制化模型政策,每個企業獨有模型參考名額系數

1.2.參考我們往期開發的模型項目,其模型效果可以達到以下資料:80%以上的客戶預測誤差小于50%,效果示例如下:

中小微企業中的營業額與收入評估的風險模型預測

編輯切換為居中

添加圖檔注釋,不超過 140 字(可選)

關于該經營情況的預測内容,詳細的實操可以參考下番茄風控往期的内容:

營業額預測模型開發|基于電商貸營業額模型的實操開發

二.小微信用評估模型(逾期模型)

小微信用評估模型,也可以稱為逾期預測模型,信用不良就會造成違約。參考我們之前的項目開發的相關資料,要做到一個較為不錯的模型,其大概的資料次元需要有以下幾個條件:

①資料來源于10萬以上的真實還款樣本;

②并且基于現有不斷增加的實際生産資料,對模型不斷疊代優化;

③同時對行業做了細分,并且綜合了工商、司法、财稅、發票、企業基本資訊等模組化變量,綜合各個次元評價了企業的信用情況,采用至少三年的曆史資料。

模型訓練後的評估結果:

KS達到0.6以上,模型穩定性好,無論是通用場景還是分行業場景預測性都有較好保障。

訓練集:roc_auc=0.7401

測試集:roc_auc=0.6321

整體:KS value=0.6741

中小微企業中的營業額與收入評估的風險模型預測

編輯切換為居中

添加圖檔注釋,不超過 140 字(可選)

對于曆史資料不全(曆史3年),财稅票資料有缺失值的客戶,我們用梯度提升樹 LightGBM來建構信用評分模型,KS達到0.4左右,模型通用性好。

另外模型開發中有一些需要注意的細節有:

①模型使用了梯度提升樹LightGBM中,個人參數參考(num_boost_round=5000, early_stopping_round=500) ; ②該模型會存在一定的過拟合風險,該問題會随着未來樣本數量的增加進行疊代優化*由于資料可能存在一定或較強的非線性表達能力,後期在對樹模型進行疊代的同時,會進行深度神經網絡 的模型訓練;

綜上,模型開發完成後,大緻名額參考大概有:

ROC達0.76;

KS達0.36;

模型整體效果還是不錯:

中小微企業中的營業額與收入評估的風險模型預測

編輯切換為居中

添加圖檔注釋,不超過 140 字(可選)

中小微企業中的營業額與收入評估的風險模型預測

編輯切換為居中

添加圖檔注釋,不超過 140 字(可選)

關于以上中小微财稅票中的資料和模型相關的内容,有興趣的童鞋可關注

《中小微企業風控中的财稅票資料的使用與模型開發》:

中小微企業中的營業額與收入評估的風險模型預測

編輯切換為居中

添加圖檔注釋,不超過 140 字(可選)

...

~原創文章

繼續閱讀