普惠金融的發展遇到移動化的浪潮,使得消費信貸迎來了高速攀升期,同時也給風控帶來了巨大的挑戰,即在額度區間廣、借貸頻次高、客群下沉情況下,如 何實作風險可控、差異化定價、快速審批。幸而大資料和AI技術使得這一切變為可能,拍拍信一直在做這方面的探索,旨在整合資料資源、充分發掘資料潛在 價值,幫助金融機構夥伴搭建和優化風控系統,本次陳磊将分享相關的實踐經驗和落地案例。
目前消費金融規模持續增長,風險控制的挑戰也與日俱增。
![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsISM9knehx2X4dnJ10TbvJnZ4dnJwJWZ31Dc0ZyZlBna9QXbm9Fe39DM0YzLcdWWzJzTQR2dxAHOwNzcat2dElEZjNVROpEaXFWazJWaFlHM5w0UGV2ZUhlUSVXNjlGZzUUbjlGNw0UW1g2QB5kU2JHUuRGbWBjZmFUOaZUcItGN4dmUGNHez8CXnBnafpXai1Wbvwlbj5yYpBXcuoXai1Wbvw1LcpDc0RHaiojIsJye.jpg)
陳磊老師現場分享
請參見一個風控系統的雛形架構,涵蓋了使用者貸前和貸後的流程。
資訊是為決策提供主要支撐。在信貸業務中,資訊四要素是姓名、身份證、手機号、銀行卡号。
比如在資訊采集上,我們會用AI的技術來提取相關資訊,比如OCR,用拍照的方式來提供身份證、銀行卡号的資訊。這樣做的優點顯而易見——提高使用者體驗,效率快,避免僞造的情況。
整個閉環模式中,我們會根據不同的客戶發起不同的政策,對于優質客戶會提高額度,同時我們也會避免不良資産導緻壞賬而采取措施。
風險流程就是一個資料的流程,包含資料的采集,消化、回收、落地。
離開資料,風控就是無水之源。
傳統的風控資料就是征信類的資料,很顯然,這是遠遠不夠的。那麼新型時代的發展也讓我們有新的思考,有哪些資料可以為我們的風控作補充。
理想化的資料就是覆寫率高,又和風險高度相關的。
這裡我們借用金字塔模式來介紹的可用資料:
我們在資料大爆炸的年代,什麼樣的資料都可以使用。
但是怎麼使用,确實一個挑戰。
這些挑戰來源于以下幾個次元:
在傳統銀行的風控體系中,無論是采用機器學習,還是人工标記,都需要專家來看怎麼去做,如何做才能發揮作用。
鑒于特征提取都是以人為主,這就難免會有局限性,很多高次元、寬廣度的資料衍生出來新的特征就很難用經驗進行捕捉。
下圖是google在使用的一個專家+機器的特征工程模型架構:
左邊是比較明顯的廣度特征,專家可以憑經驗直接提取
中間廣度加深度模型,一些不易解讀的資料需要加工重構才能得以解讀
右面是需要深層挖掘、層層解析後才會出來的特征
下面是一份團案資訊圖譜的案例:
資訊圖譜在業務上的所反映的問題,在于最原始的出發點是什麼, 什麼形式關聯,在關聯上有什麼途徑。一層關聯比較簡單,怎樣能夠發現多層關聯才更為關鍵。
從聚合資料的輸出與查詢,可以看出一步關聯與二次關聯的資料聯系。
而更深層次的特征查詢,能對關系網絡形态位置,把非結構化的關系網絡轉化為一般模型可以能吸收并消化的特征向量,進而檢測到異常客戶。
以上講了很多特征提取。下面是闡述如何落地,從圖中模型可以看出,主要流程是對不同的資料源做不同的資料提取,抽象到幾個風險因子,進而提煉出綜合風險指數,化繁為簡。
在風控體系中,我們追求準确性,同時也強調健壯性。
準确性是指特征的抽象與提取,那麼健壯性就是指時間次元上的有效性、場景遷移的可擴充性。
原文釋出時間為:2017-10-24
本文作者:陳磊