文章目錄
- 0. 背景
- 1. 第一代系統
-
- 1.1 目标
- 1.2 架構
- 1.3 功能說明
- 2. 第二代系統
-
- 2.1 目标
- 2.2 架構
- 2.3 功能說明
- 3. 第三代系統
-
- 3.1 目标
- 3.2 架構
- 3.3 功能說明
- 4. 第四代系統
-
- 4.1 目标
- 4.2 架構
- 4.3 功能說明
- 彙總
- 參考
- 風控系列文章目錄
0. 背景
目前國内已經很多優秀的風控服務商,如同盾科技、數美科技、網易易盾等。本文根據自己的了解,給出了從頭建構一個完整風控系統的一個思路。共分為了4個階段,每個階段根據不同的目标,實作不同的功能。下面進行具體的描述。
1. 第一代系統
第一代系統架構。
1.1 目标
快速實作并且能夠解決最為簡單的風險問題。
1.2 架構
1.3 功能說明
重要優先級是處置系統、特征計算、政策引擎。
- 處置系統:處置方式會有很多,最基本的是人工稽核。對于大部分場景,人工稽核都是必須的。人工稽核的優勢很明顯,劣勢是耗費人力,并且這個随着業務增長,消耗也是呈現線性增加的。
- 特征計算:業務剛開始時特征計算會和政策甚至是處置耦合到一起,在沒有大量政策的情況下,這種模式的效率較高。不過随着風險問題增多,特征計算就需要和政策進行拆分。這個階段主要處理的問題可以分成以下幾種:
- 頻率特征:統計不同的次元和不同次元組合,對不同次元進行頻率控制。頻率的門檻值可以根據整體業務頻率分布的置信區間來定制。
- 内容特征:文本類可以使用關鍵詞、正則和文本相似;圖像等可以使用圖檔相似,OCR等;其他媒體類似。
- 政策引擎:政策引擎是一個很核心的功能,後期政策引擎會逐漸變得簡單可用,能夠處理各種緊急問題。目前有很多開源的引擎如drools。政策引擎需要支援基本的與或條件組合,需要對>,<, =,!=,in,like,等計算進行支援。政策識别和處置豁免邏輯盡量在邏輯上解耦,避免因為識别未處置造成風險而不知。
2. 第二代系統
2.1 目标
- 自動發現嚴重的問題,并進行管控。
- 将已經解決和識别的風險,轉變為知識。
2.2 架構
2.3 功能說明
- 無監督風險發現:使用聚類算法對聚集的風險進行識别,并通過政策進行控制。常用的如minhash,kmeans等。
- 知識庫:手機黑庫、裝置黑庫、使用者黑庫、IP黑庫等。不僅能夠将能力進行固化,還能解決跨業務的問題。
3. 第三代系統
3.1 目标
- 引入更為專業的人員和方法。
3.2 架構
3.3 功能說明
- 深度學習模型:使用深度模型,可以提升識别的泛化能力,減少對抗的頻率。深度學習通常屬于方案B,對于新的問題,需要方案A先進行緊急處理,等待模型訓練上線。
- 專家系統:政策計算的更新版。行業專家可以通過系統,實作各種特征,而不需要進行開發。這樣對各種風險問題都能進行高效的管控。同時專家系統可以配合人工稽核,進行各類專項治理。
4. 第四代系統
4.1 目标
- 更為深入的機器學習算法。
4.2 架構
4.3 功能說明
- 畫像&知識庫:随着業務的複雜性的提升,需要進行更精細話的操作,這樣就需要對各種業務物料、使用者設定标簽,同時豐富的标簽可以用于模型中。
- 行為識别模型:通過行為識别,可以更細粒度的進行風險管控,通過使用者簡單的幾個行為,就能判斷出是否有風險。避免像頻率一樣,需要累積到一定程度。
彙總
要解決的問題從簡單到複雜,對應的系統也需要從簡單到複雜,重要的不是功能有多完善有多強,而是适合目前的階段,能夠很高效的解決掉80%以上的問題。
本文隻是說了簡單的一個思路,還有很多問題,後面慢慢的補吧。
參考
數美科技
網易易盾
同盾科技