天天看點

網際網路欺詐花樣百出,人工智能如何加強金融風控體系?

編者按:去年p2p公司遇冷後,紛紛轉型稱會用大資料、機器學習等科技手段服務金融,搖身一變成為時髦的fintech金融科技公司。但實作過程并不簡單,讓機器代替人去處理資料做判斷,在國内金融領域才剛剛起步。

creditx氪信是雷鋒網(公衆号:雷鋒網)接觸的一家用機器學習做風控的公司,在金融領域擁有不少實驗經驗和思考。本文援引creditx氪信在招商銀行信用卡中心年度務虛會教育訓練幹貨内容為例, 來解析人工智能和機器學習将會如何登上金融風控的主要舞台。

對于躲在觸屏手機背後的客戶,更廣範圍缺失征信資料的客戶,金融風控體系已愈發難以通過傳統風控手段去判斷使用者是謙謙君子還是騙子流氓,而人工智能作為過去網際網路搜尋、推薦處理上百萬維資料的最重要手段,在處理新金融業務萬維資料方面,正形成有效的降維颠覆。

在談及機器學習在金融場景中的實際應用之前,首先我們以金融風控信用貸業務流程舉例進行梳理,通常一個風控業務包括前端頁面使用者資料申請送出和收集,反欺詐、合規、邏輯校驗,核心決策授信包括申請評分和電調,以及最後的催收。

面對這套業務流程, 新金融風控領域面對的資料痛點,一般有幾大類:

網際網路欺詐花樣百出,人工智能如何加強金融風控體系?

業務流程上,機器學習已經在每個風控節點發揮作用。比如反欺詐環節,在泛網際網路的環境裡,

金融風控面臨的傳統個體欺詐已迅速演變為有組織、有規模的群體欺詐和關聯風險。而傳統反欺詐還停留在識别一度風險等這種簡單規則方式,如聯系人中借貸人個數等,對于二度、三度乃至更廣範圍的網絡全局風險苦無良策。機器學習裡面基于圖的半監督算法很好地解決了這一訴求,基于申請人、手機号、裝置、ip位址等各類資訊建立節點,再根據其申請關系、電話關系、擁有關系等生成邊,我們就可以建構龐大網絡圖并在此之上可進行基于規則和機器學習的反欺詐模型實時識别。

網際網路欺詐花樣百出,人工智能如何加強金融風控體系?

在申請評分環節,傳統金融風控往往是基于評分卡體系對強征信資料如銀行借貸記錄等進行模組化,而新金融的業務下,客群的進一步“下沉”,覆寫更多收入群體,新增群體的強征信資料往往大量缺失,金融機構不得不使用更多弱金融資料,

辟如消費資料、營運商資料、網際網路行為資料等。這類底層資料的改變,對傳統信用評分卡造成了巨大的困難,具體展現在:

1.諸如網際網路行為、營運商資料很多都是非結構化資料,資料繁雜, 模組化前的特征工程很難用傳統人工的方式完成加工。 2.由于資料類型和範圍的大幅擴大,新模型面對的往往是加工出來的上千維弱變量特征,評分卡體系根本無法融合吸收這些特征。 3.機器學習先進風控技術也帶來了模型“黑盒”的問題,如何了解和把控黑盒結果與風險之間的關系已成為ai技術在金融領域應用的一大門檻。

人工智能和機器學習對上述問題有獨到處理:

面對資料繁雜的問題,基于深度學習的特征生成架構已被成熟運用于大型風控場景中,通過如rnn、詞嵌入、lstm、cnn等深度學習神經網絡可成熟實作對時序、文本、圖像等稀疏屬性資料的特征逐層提取。僅以cnn或lstm提取短信文本特征為例,文本通過訓練好的詞向量模型映射到嵌入向量,通過cnn完成特征提取,最終進入分類器網絡即可将文本資料與違約風險實作深度挂鈎。

網際網路欺詐花樣百出,人工智能如何加強金融風控體系?

而成熟場景上的實踐也證明,機器生成特征正顯現出對模型效果超出想象的提升,深度學習對于挖掘深層時序關系,文本内容深層含義等都超越了人工定義的深度。

網際網路欺詐花樣百出,人工智能如何加強金融風控體系?

【圖注】上圖為大型信用貸場景中模型重要性特征清單,機器學習特征比例已經超過專家人工特征。

針對資料駕馭難的挑戰,由于傳統評分卡模型在面對上千次元弱變量且存在大量缺失值的情況下無法應對,目前氪信在大型金融場景核心風控系統中的成熟實踐經驗是複雜內建模型。通過對機器學習特征和專家人工特征建構規則模型、機器學習模型、深度學習模型等并進行複雜內建,即可靈活應對客戶全方位需求,實作對不同使用者的高度差異化定價,同時充分利用不斷産生的資料和監控模型性能持續進行模型線上快速自疊代,為客戶實作自适應的外部風險變化。

網際網路欺詐花樣百出,人工智能如何加強金融風控體系?

此外,我們知道金融風控專家都很關心模型的可解釋性,而機器學習是一個“黑盒”,其中的風險很難去把控和估計,這與金融場景的訴求是沖突的。目前氪信通過不斷地驗證,已成熟實作lime模型解釋器在風控場景中的應用。其原理在于對局部分界面以線性函數拟合部分曲線,就能夠做到捕獲影響結果的關鍵變量,并展示給我們的風控專家讓其迅速了解結果和特征之間的内在聯系。

事實上,機器學習要解決的問題很清晰,所有的這一套資料适配融合、群體反欺詐、特征工程、模型建構和訓練、性能監控與自疊代的機制,包括深度學習,半監督學習,線上學習等技術,核心都是為了将網際網路級别的機器學習技術“降維”應用到金融領域,解決新金融場景上資料的獨特性,一方面可用資料比網際網路要少,另一方面又比傳統評分卡體系多了很多不可解釋、高維稀疏的大資料。

網際網路欺詐花樣百出,人工智能如何加強金融風控體系?

本文作者:溫曉桦

繼續閱讀