天天看點

為了防止信用卡盜刷,機器學習算法給你畫了一副「肖像」

盜刷信用卡風險已經成為困擾全球銀行信用卡部門的難題之一。僅以美國為例,美聯儲的支付調查報道顯示,2012年全美信用卡支付總金額達到260億美元,這其中未經授權的信用卡支付,也就是盜刷信用卡的金額高達61億美元。

對銀行而言,衡量信用卡交易的風險非常困難。要實作這個目标必須快速确定哪些交易是合法授權,哪些交易是盜刷的。那麼這些工作又是如何實作的呢?

站在消費者的立場來看,檢測信用卡盜刷的過程似乎很「神奇」,這種檢測幾乎是瞬時發生的,背後涉及到一系列複雜的技術,從金融到經濟到法律再到資訊科學。當然,有些信用卡盜刷的檢測很簡單,比如,當機器發現信用卡刷卡地的郵編與發夾地的郵編不符時會發出警告。

傳統的信用卡檢測需要大量人力參與到海量資料的分析判斷上,算法隻會對一筆交易發出警告,最後人類稽核員會打電話确認這筆交易是否涉嫌信用卡盜刷。現在,由于交易量激增,各大銀行的信用卡部門開始依靠大資料,并通過機器學習和雲計算的方法快速甄别未經授權的信用卡交易。

用于信用卡檢測的機器學習算法首先将被海量正常的交易資料和持卡人資料進行訓練。交易結果會成為機器了解交易的一個重要次元,比如一個正常人可能每周買一次電、每兩周去一趟購物中心等等,這些交易結果将成為正常交易的模型。

接下來,機器将接受實時交易資料的考驗,并給出該交易是否不合法的機率,比如97%,如果檢測系統設定每筆交易不合法的機率不能高于95%,那麼所有這些交易将被拒絕接受付款,換句話說,交易不會成功。

為了防止信用卡盜刷,機器學習算法給你畫了一副「肖像」

這個算法考慮的因素很多,包括刷卡供應商的信任度、插卡讓購買行為(時空次元)、IP位址等等,考慮的因素越多,其建構的模型也越準确。

這個檢測的過程幾乎是實時的,這也是人類工作者無法達到的檢測速度。但整個流程中還是需要人類的參與,包括人類對算法判斷的稽核以及随後的信用卡欺詐跟蹤等等。

金融交易過程中的資料非常大,比如目前PayPal要處理1億690萬使用者的1.1PB資料。但對機器學習而言,越多的資料意味着越能提升自身的算法準确度,進而更好地識别盜刷信用卡的事件。海量資料對于銀行IT系統的硬體要求非常高,資料的存儲、讀取和分析,都成為巨大的IT開支。

目前,銀行的信用卡部門開始使用雲計算作為處理海量資料的方式,雲計算彈性可伸縮的特性能夠機器學習算法運作的效率,有效應對諸如雙11等刷卡高峰期時的信用卡檢測

圍繞信用卡盜刷和反盜刷的戰争一直在持續,借助于機器學習、大資料和雲計算以及今後可以實作的區塊鍊技術,未來我們的錢包和卡包會越來越安全。