文章目录
- 0. 背景
- 1. 第一代系统
-
- 1.1 目标
- 1.2 框架
- 1.3 功能说明
- 2. 第二代系统
-
- 2.1 目标
- 2.2 框架
- 2.3 功能说明
- 3. 第三代系统
-
- 3.1 目标
- 3.2 框架
- 3.3 功能说明
- 4. 第四代系统
-
- 4.1 目标
- 4.2 框架
- 4.3 功能说明
- 汇总
- 参考
- 风控系列文章目录
0. 背景
目前国内已经很多优秀的风控服务商,如同盾科技、数美科技、网易易盾等。本文根据自己的理解,给出了从头构建一个完整风控系统的一个思路。共分为了4个阶段,每个阶段根据不同的目标,实现不同的功能。下面进行具体的描述。
1. 第一代系统
第一代系统框架。
1.1 目标
快速实现并且能够解决最为简单的风险问题。
1.2 框架
![](https://img.laitimes.com/img/_0nNw4CM6IyYiwiM6ICdiwiI2EzX4xSZz91ZsAzNfRHLGZkRGZkRfJ3bs92YsAjMfVmepNHL1E3N1k2TyVTRxVTNvFXW1wkNiVTQClGVF5UMR9Fd4VGdsATNfd3bkFGazxSUhxGatJGbwhFT1Y0Mk9VZwlHdssmch1mclRXY39CXldWYtlWPzNXZj9mcw1ycz9WL49zZuBnL2kTM4gzN5YzM4EmMyYjMiRmMhRjZ3cDOiNTNwIDO1M2Lc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
1.3 功能说明
重要优先级是处置系统、特征计算、策略引擎。
- 处置系统:处置方式会有很多,最基本的是人工审核。对于大部分场景,人工审核都是必须的。人工审核的优势很明显,劣势是耗费人力,并且这个随着业务增长,消耗也是呈现线性增加的。
- 特征计算:业务刚开始时特征计算会和策略甚至是处置耦合到一起,在没有大量策略的情况下,这种模式的效率较高。不过随着风险问题增多,特征计算就需要和策略进行拆分。这个阶段主要处理的问题可以分成以下几种:
- 频率特征:统计不同的维度和不同维度组合,对不同维度进行频率控制。频率的阈值可以根据整体业务频率分布的置信区间来定制。
- 内容特征:文本类可以使用关键词、正则和文本相似;图像等可以使用图片相似,OCR等;其他媒体类似。
- 策略引擎:策略引擎是一个很核心的功能,后期策略引擎会逐渐变得简单可用,能够处理各种紧急问题。目前有很多开源的引擎如drools。策略引擎需要支持基本的与或条件组合,需要对>,<, =,!=,in,like,等计算进行支持。策略识别和处置豁免逻辑尽量在逻辑上解耦,避免因为识别未处置造成风险而不知。
2. 第二代系统
2.1 目标
- 自动发现严重的问题,并进行管控。
- 将已经解决和识别的风险,转变为知识。
2.2 框架
2.3 功能说明
- 无监督风险发现:使用聚类算法对聚集的风险进行识别,并通过策略进行控制。常用的如minhash,kmeans等。
- 知识库:手机黑库、设备黑库、用户黑库、IP黑库等。不仅能够将能力进行固化,还能解决跨业务的问题。
3. 第三代系统
3.1 目标
- 引入更为专业的人员和方法。
3.2 框架
3.3 功能说明
- 深度学习模型:使用深度模型,可以提升识别的泛化能力,减少对抗的频率。深度学习通常属于方案B,对于新的问题,需要方案A先进行紧急处理,等待模型训练上线。
- 专家系统:策略计算的升级版。行业专家可以通过系统,实现各种特征,而不需要进行开发。这样对各种风险问题都能进行高效的管控。同时专家系统可以配合人工审核,进行各类专项治理。
4. 第四代系统
4.1 目标
- 更为深入的机器学习算法。
4.2 框架
4.3 功能说明
- 画像&知识库:随着业务的复杂性的提升,需要进行更精细话的操作,这样就需要对各种业务物料、用户设置标签,同时丰富的标签可以用于模型中。
- 行为识别模型:通过行为识别,可以更细粒度的进行风险管控,通过用户简单的几个行为,就能判断出是否有风险。避免像频率一样,需要累积到一定程度。
汇总
要解决的问题从简单到复杂,对应的系统也需要从简单到复杂,重要的不是功能有多完善有多强,而是适合当前的阶段,能够很高效的解决掉80%以上的问题。
本文只是说了简单的一个思路,还有很多问题,后面慢慢的补吧。
参考
数美科技
网易易盾
同盾科技