天天看點

網際網路金融風控模型大全

一、市場調研

目前市面主流的風控模型

1、網際網路金融前10名排行榜(資料截止日期2017-09-12)

網際網路金融公司排名分别是螞蟻金服、陸金所、京東金融、蘇甯金融、百度金融、騰訊理财通、宜信、錢大掌櫃、萬達金融和網易理财。

1.1 螞蟻金服

1.1.1 大資料技術

對接第三方征信公司芝麻信用分,通過使用者信用曆史、行為偏好、履約能力、身份特質、人脈關系五個次元對海量資料行綜合的處理評估,同時也給予阿裡電商交易和螞蟻金服網際網路金融交易資料,對接公安系統和第三方資料公司建立聯系。(這塊就是使用者畫像的作用,投資人畫像,融資企業/個人 畫像,這塊的内容比較複雜。後面一定會展開分析,風險定價,推薦系統全部靠它了)

1.1.2 人臉識别技術

人臉識别技術核心算法分别是活體檢測算法、圖像脫敏算法以及人臉比對算法,國際公開人臉資料庫 LFW 上,人臉識别算法準确率(99%)。(像這塊的技術已經很成熟有百度都已經推出成型産品,可以通過人臉識别對融資企業/法人進行風險驗證,是否存在風險欺詐,多頭借貸等嫌疑)

1.1.3 雲計算技術

是一個開放的雲平台,它助力金融創新、助力金融機構的IT架構實作更新,去建構更加穩健安全、低成本、靈活創新的金融級應用。(其實就高可用,可靠性等)

1.1.4 風控技術

曆史交易資料進行個性化的驗證,提高賬戶安全性。80%左右的風險事件在智能風控環節就能解決。除了事後稽核,事前預防、事中監控也非常重要——事前,将賬戶的風險分級,不同賬戶對應不同風險等級;事中,對新上線的産品進行風險評審以及監控政策方案評審。(解決80%的問題是以這塊才是真正的核心。貸前,貸中,貸後等方方面面的監控,貸前最為重要,如何去檢測,抓取哪些資料,與哪些第三方平台合作)

1.1.5 人工智能技術

螞蟻金服通過大資料挖掘和語義分析技術來實作問題的自動判斷和預測。可以識别到使用者的身份資訊,總結在大的使用者層面大家可能都會遇到的問題,100%的自動語音識别。智能質檢能力與智能賠付能力,具備了品質的判斷能力以及情感判斷能力。(總結:公司 PC 的人工語言不完善,很多關鍵字無法識别。這塊應該跟背景沒有互動,資料都是寫死。移動端也可以考慮在标的詳情頁介入 draglayout 控件進行智能語音服務,解答使用者疑惑。技術核心應該是在資料挖掘,語義分析技術等方式)

1.2 陸金所風控調研

1.2.1 七步風控體系

1、風險政策制度架構體系:所有交易對手和産品引入都制定了明晰的風險政策指引,所有業務必須在制度架構内運作。(說白了就是自己風控業務流程,對于投資人者以及融資使用者進行風險等級劃分)

2、信用評級:交易對手和産品進行主體評級及債項評級。(對于投資人者、融資使用者、産品進行風險等級劃分)

3、資訊披露:針對每一個不同的産品,将其内部評級、底層資産、主要風險、還款來源、保障措施。(就目前風險披露資料隻是按照國家要求進行風險披露,但是并沒有标地産品進行風險披露,融資企業進行風險披露,這個披露系統可以做成風險評估報告,後期也可以利用企業供應鍊關系庫一定會用到(但是這部分資料都是針對上市而言,資料不全;))

4、投後預警監控:所有在售資産至少每三個月進行一次檢視。(對于融資周期過長的企業可以每三個月進行企業經營狀況的上報,重點在于資金用途,回款方式以及周期;如果我們企業夠強大的話,可以利用大資料征信對于那些未按時回款融資企業使用者的企業進入黑名單系統)

5、風險管理系統:陸金所的風險管理系統覆寫全産品線、整個産品生命周期,實作風控的标準化、智能化、模型化,大幅提升陸金所風險管理工作的效率和效果。(這些東西都太虛了)

6、風險評價體系:同的風險程度給予業務部門不同的業績評價。

7、資産、資金的精準比對:投資者進行風險分類,産品與投資者風險适配系統,確定投資者都能買到适合其投資風格與風險偏好的産品。(個人認為這個才是風控的意義,還有我們平台本身存在的價值;具體的實作的方式,利用畫像技術對于投資使用者,融資使用者,标的産品進行風險等級劃分,通過資料挖掘進行實時推薦)

小結

風險評級分為三部分:投資人風險等級分類,融資企業資訊等級分類,标的産品等級劃分。

投資人等級劃分:可以參考以往投資标的的利率,投資金額,投資人的站崗資金,投資人的提現金額,也可以通過投資人基本個人資訊,例如移動裝置Android 或 IOS,年齡,居住地,職業,評判投資人也可以調用第三方平台去綜合判斷投資的經濟狀況等方面次元

融資企業等級劃分:企業所在行業的整展現狀,國家政策是否扶持,企業的納稅證明,銀行流水,公司規模,注冊資本等次元

标的産品 :項目所屬行業,項目的整體周期,項目成本,利潤率,項目的合作企業,項目合同,發票等内容等次元

投資使用者與産品比對度

根據風險評級系統去高度比對融資使用者,産品标的的内容資訊。這部分用到的應該是資料挖掘,推薦系統。根據使用者以往投資标的金額,利率進行離線推薦,也可以根據使用者的點選流日志分析去進行實時推薦,在某個标的詳情頁的停留時間,标的的點選次數資訊。

1.3 京東金融風控調研

1.3.1 使用者支付瞬間需要做的事情

如判斷使用者的裝置資訊、登入行為、通路特征、信用狀況、商品資訊、商家特征、配送區域、銀行卡狀态等。如建立信用、反欺詐、僞冒交易等一系列模型,其中多達近百項的模型需實時計算。這樣龐大的運算量在一秒内,甚至幾十毫秒内完成,不是易事。 (感覺這些内容任何一點都夠我研究一段時間的)

1.3.2 風控的靈魂是資料,所有決策都以資料為驅動

1、業務系統産生的資料和點選流作為主要挖掘的素材來源;但是随着時間推移,惡意使用者可以模仿真實使用者。是以才會用裝置指紋識别,生物探針,語音識别,人臉識别等。

2、風控模型

原始層資料: 由于原始資料存在雜亂無章的現象,此處使用各種顔色來示意

資料原子化: 資料原子化是經過整理後,把資料按業務歸屬分類,形成最原子的類别,比如賬戶,資金,投資,消費等

資料抽象層: 按風控關注的業務做資料整合,這層是最貼近業務的。每一塊代表一類業務,一個原子資料類是可以被放入多個抽象資料塊裡的

資料模型層: 對分析場景使用的,基本就是一個資料模型塊對應一個分析場景。

3、機器學習在京東金融的天盾風控系統應用

根據經驗,在算法的選擇上盡可能的多做選擇,對比模型的性能擇優選取。另外,對樣本庫做好治理工作,可使用随機抽樣和使用聚類把樣本資料分層抽取。這些工作是模組化人員在大資料環境中也就是離線做的,那麼,怎麼把訓練的模型應用到線上做實時呢,下圖是架構:

京東金融目前正在開發機器學習平台,讓懂機器學習的人就可以使用機器學習做想的事情,目前懂機器學習的人不在少數,但真正使用機器學習做具體事情不多,故此平台不但滿足内部模組化訓練、釋出等,還可對外輸出。

資料風控還有很長的路要走,如量化投資風險評估與營運也屬風控範疇,風控也可和推薦領域相結合。如資料會有階段性差異,品質會随時間推移,慢慢發生變化,可能花費很大精力産出的預測産品會失效,調整代價難易不可估。如不同場景準确度和覆寫度都是不同的,尺度如何把握。如怎樣能降低統計分析學和分布式計算相結合的成本等等。

總之,網際網路金融風控核心還是服務客戶,提升産品價值,最大程度的做到差異化的防範,智能化是風控的發展方向,京東金融從開始就緻力于打造智能化的風險管控解決方案。(機器學習部分了解)

2、第三方風控産品以及服務(資料截止日期2018-01-12)

20強榜單分為三個梯隊,三個梯隊覆寫的放貸機構數量依次遞減,大緻比例為10:3:1。

第一梯隊(5家):放貸類公司使用最集中的征信機構,分别是上海資信、同盾科技、芝麻信用、鵬元征信和百融金服。

第二梯隊(8家):FICO、聚信立、緻誠信用、EXPERIAN、安融征信、考拉征信、前海征信、維氏盾征信。

第三梯隊(7家):GEO集奧聚合、白騎士、華道征信、立木征信、算話征信、銀聯智策、正信用。

前海征信可以擷取到個人使用者的公積金資訊。芝麻信用目前是最優秀的征信公司,當中很多公司有自己管道去擷取使用者的資訊 。

3、國家政策法規

1、 個人單平台借貸餘額不能過20萬

2、 個人全部平台借貸餘額不能過100萬

3、 企業法人單平台借貸不能過100萬

4、 企業全平台不能過500萬

從政策層面上來p2p服務的是屬于中小企業,p2p行業不利。是以風控顯的更加尤為重要。通過風控模型擷取優質的資産。

二、風控模型

風控模型應該是從兩個角度去考慮,第一個角度是資産端風控政策,第二個角度是資金端風控政策。考慮主要出發點應該是從貸前、袋中、貸後三個方向去考慮,結合傳統業務的風控模型和互聯使用者的行為資料。針對資金,資産進行風險等級劃分,防欺詐系統、袋中的輿情監控、貸後的權重疊加。

1.1 欺詐使用者的識别

1.1.1、防欺詐風控系統,下面我列舉的參考次元名額;針對黑色産業業務梳理

根據現有資料統計分析移動端登入使用者占比與 PC 使用者占比為8:2劃分,是以移動的防欺詐系統為主要參考因數,

1、根據以往的業務系統資料可以建立黑名單、白名單。

白名單: 可以通過建立資料模型已經資料挖掘,機器學習相關算法進行優質使用者的挖掘。

黑名單: 黑名單企業可以針對那些逾期、破産企業(法人作為黑名單)、通過手機号碼、imei作為使用者判斷辨別,調用第三放征信公司去進行鑒别。

2、對移動端使用者進行實時監測,擷取用經緯作為、擷取使用者重力感應資料、mac 位址、ip、移動裝置注冊時長等資料判斷使用者是否存在惡意欺詐,惡意注冊

1.2 可信度分析

1.2.1、風險等級劃分

風險等級劃分,分為三種類型、投入使用者風險承受能力等級劃分、融資企業以及個人使用者的等級劃分、融資項目标的等級劃分

1、投資使用者等級劃分:可以參考投資年齡、居住地、職業、銀行流水、固定資産、收入、學曆等角度去劃分

2、融資企業等級劃分:企業所在行業、國家政策、企業現金流、企業注冊資本、管理層背景、資産負債率、法人個人資訊、企業納稅證明、公司人員數量等次元去

3、标的資訊:标的項目類型、回款周期、合作企業、回款方式、融資金額

1.3 貸後預警

對于回款周期比較長的項目,可以至少三個做個回訪、讓融資企業按時提供目前經營現狀、融資标的是否按時回款。根據貸後的狀态進行預警、等級劃分

四、技術實作

使用者畫像、人臉識别、推薦系統、智能語音、資料挖掘、風控模型。

風控系統業務流程

訪使用者欺詐系統

風險評估等級劃分系統

使用者畫像

使用者點選流日志分析系統

推薦系統

風險預警系統

風險定價系統

五、産品與服務

參考科法智能提供的服務與産品,将案例資訊換位标的資訊、将訴訟公司換位融資企業。對照資料就可以解決提供類似的服務。下面是具體相關部分資訊。

企業信用資訊查詢

包括企業基本資訊、經營狀态、法人以及高管資訊披露

對于一些重要資訊提供收費服務、本平台高等級投資使用者可以免費檢視,比如企業的目前經驗狀況、本平台内部信用等級、所在行業排名等。

企業融資項目标的資訊查詢

結合本平台以往類似融資項目資訊曆史資料進行資訊關聯、結構歸類、風險解讀、精準檢索。出具融資項目風險測評報告

對于優質資産本平台進行充分的資訊披露

科法智能邏輯思維導圖

網際網路金融風控模型大全

繼續閱讀