天天看點

基于關系的違規團夥發掘風控方案

業務背景

目前很多平台方都有團夥作案的情況發生,比如團夥性薅羊毛,比如團夥性的制造一些虛假資訊,團夥性發送違法廣告。之是以是團夥性作案,因為作案人員之間有某種關系連接配接。當業務方擷取了人員關系之後,能否成功挖掘出違規團夥,關系到平台的安全。

業務痛點

絕大部分客戶可以通過SNS留言、轉賬、通話等資料建構出使用者關系網絡,并且可以甄别出網絡中部分違規客戶,缺乏有效的智能化的方案對全網所有客戶進行是否違規的判斷。

解決方案

PAI平台提供了一套基于關系圖挖掘的的算法,包含标簽傳播、最大聯通子圖等經典圖算法

1.人力要求:需要具備基礎的圖挖掘算法背景、懂得關系型資料的構模組化式

2.開發周期:1-2天

3.資料要求:可以将資料建構成點邊點的模式,點指的是每個使用者,邊指的是某種關系(關系可以是通話、轉賬、留言等等)

資料說明

下圖是已知的一份人物通聯關系圖,每兩個人之間的連線表示兩人有一定關系,可以是同僚或者親人關系等。已知“Enoch”是信用使用者,“Evan”是欺詐使用者。需要通過圖算法,計算出其它人的信用指數,即得到圖中每個人是欺詐使用者的機率。這個資料可以友善相關機構做風控。

基于關系的違規團夥發掘風控方案

)

上圖對應的資料集如下,上圖是個有向圖,每個點代表一個人,每個人都是一個start_point,每個start_point都連接配接一個end_point。count表示start_point和end_point的連線,count值越大說明start_point和end_point這兩個人的關系越密切。

基于關系的違規團夥發掘風控方案

特征資料:

參數名稱 參數描述
start_point 使用者A,每個關系連線的起點
end_point 使用者B,每個關系連線的終點
count 使用者A和使用者B的關系程度

流程說明

進入PAI-Studio産品:

https://pai.data.aliyun.com/console

該方案資料和實驗環境已經内置于首頁模闆:

基于關系的違規團夥發掘風控方案

打開實驗:

基于關系的違規團夥發掘風控方案

1. 最大聯通子圖

最大聯通子圖的功能:圖算法的輸入資料是關系圖譜結構的,最大聯通子圖可以找到有通聯關系的最大集合,在團夥發現的場景中可以排除掉一些與風控場景無關的人。

本次實驗通過最大聯通子圖元件将資料中的群體分為兩部分,并賦予group_id。通過SQL腳本元件和JOIN元件去除下圖中的無關聯人員。

基于關系的違規團夥發掘風控方案

2. 單源最短路徑

通過單源最短路徑元件探查出每個人的一度人脈、二度人脈等關系。“distance”表示“Enoch”通過幾個人可以聯絡到目标人,如下圖所示:

基于關系的違規團夥發掘風控方案

3. 标簽傳播分類

标簽傳播分類算法為半監督的分類算法,原理是用已标記節點的标簽資訊去預測未标記節點的标簽資訊。在算法執行過程中,每個節點的标簽按相似度傳播給相鄰節點。

使用标簽傳播分類元件除了需要所有人員的通聯圖資料以外,還要有人員打标資料。本實驗通過已知資料(讀資料表)元件導入打标資料(“weight”表示目标是欺詐使用者的機率),如下圖所示:

基于關系的違規團夥發掘風控方案

4. 結論

通過SQL腳本元件對結果進行篩選,最終展現的是每個人涉嫌欺詐的機率,數值越大表示是欺詐使用者的機率越大,如下圖所示:

基于關系的違規團夥發掘風控方案

總結

通過PAI-Studio内置的基于關系的違規團夥發掘方案可以基于使用者的關系網絡自動識别出全網每個使用者的風險值,做到違規團夥智能化挖掘的作用,常被應用到金融、社交、電信等行業。