天天看點

機器學習和大資料——提高信用卡安全性

Intetix Foundation(英明泰思基金會)由從事資料科學、非營利組織和公共政策研究的中國學者發起成立,緻力于通過資料科學改善人類社會和自然環境。通過聯絡、動員中美最頂尖的資料科學家和社會科學家,以及分布在全球的志願者,我們創造性地踐行着我們的使命:為美好生活洞見資料價值。

當你在家卻接到信用卡檢測中心的電話詢問你剛剛是否在某個商場完成支付,而事實上這個時間段你根本沒有出門,更别說買什麼昂貴的電器,那麼銀行是怎麼知道這可能是筆欺詐性交易呢?

正确分辨每筆商業交易的合法性對信用卡公司的利益影響巨大。美聯儲支付研究資料表明,2012年美國公民信用卡交易額達到262億美元。而同年由于未予授權的交易所産生的損失大約為61億美元。聯邦公平信用結賬法将持卡人的未授權交易責任限制在50美元,剩餘損失由信用卡公司負責。由此可見,欺詐性支付對信用卡公司盈虧的巨大影響。然而,盡管每年信用卡使用點都會接受嚴格的安全審查,仍無法真正杜絕信用卡欺詐。

對銀行業來說,風險評估起着至關重要的作用。其總目标是在造成巨大損失前,快速地判斷其是否為欺詐性質。但如何做到這一點?銀行又如何辨識信用卡盜刷呢?

提高檢測能力

因欺詐性支付過程的瞬間性,有效的反欺詐從客戶視角看來非常神奇的。這看似簡單且快速的檢測其實暗含了一系列複雜的技術,涉及财經,法律及資訊科學。

當然,也有一些相對簡單的檢測機制,無需太過先進的技術。例如,當信用卡在非常用地區使用時,無法提供其正确的郵政編碼将被視為欺詐的訓示之一。但得知受害人的郵編十分容易,通常詐騙犯都能夠輕易躲過這一正常檢查。

在過去,反欺詐支付所需的資料分析技術要求大量的人力投入。通過電腦算法發現的可疑案例,最終都需經過人工确認。現如今,過于龐大的交易數量使得信用卡公司更需依賴于大資料分析。機器學習和雲計算等先進技術将提高檢測欺詐支付的準确性。

通過機器學習判斷是否為欺詐

簡單來說,機器學習由計算機操控,通過符合特殊規則的預設過程且能自我完善的算法。計算機會先從一個模型開始,然後通過實驗和犯錯來訓練它。之後它就可以做出風險預測,例如預測金融交易相關的風險。

檢測欺詐的機器學習算法首先需用大量持卡人的正常交易資料來訓練。交易序列就是這種訓練資料的一個例子,如一個人通常每周加一次油,每兩周去一次超市購物等等。該算法學習到這是一個正常的交易序列。

這種微調過程後,我們就可以通過運作算法檢測信用卡交易,理想情況下能達到實時狀态。然後算出一個機率訓示交易被欺詐的可能性(例如,97%)。如果将欺詐檢測系統設定為阻止任何欺詐機率高于95%的交易,這個評估可以在交易發生時立即引發信用卡當機。

算法考慮了許多因素來限定欺詐交易:商家的誠信值,持卡人的購買行為(包括時間和地點),IP位址,等。資料點越多,結果越精确。

沒有人可以在分析成千上萬的資料的同時做出判斷,但機器學習可以,它使實時檢測欺詐行為成為可能。

舉一個典型的例子,當你在超市結賬刷卡時,信用卡公司将會得到具體交易細節,如時間、數額、商店名與信用卡的年限。這些資料會被提供給已學習你的采購模式的算法,通過與許多過去的采購資料點比對來分析此項交易是否符合你的行為習慣。

在你的信用卡被使用時,無論你是身處每周六早晨都會去的餐廳,還是淩晨3點在兩個時區外的加油站,算法都會立即知道你在交易,并檢查你的交易行為是否正常。如果信用卡突然在同一天超額預付兩次,而在曆史資料中沒有這樣使用過的資料,這種行為将提高欺詐機率的評分。如果交易欺詐分值高于某個門檻值,通常快速人工稽核後,算法将與銷售點系統聯系讓它拒絕交易。網上購物也會經過相同的流程。

在這種類型的系統中,大量人工幹預成為過去的事。事實上,如果一個人過于參與欺詐監測周期,那麼反應時間會變得更長。然而,人工仍然可以發揮作用——驗證欺詐或跟蹤被拒絕的交易。當一張卡被多次拒絕交易時,從業人員可以緻電持卡人,以決定是否永久取消該卡。

在雲端的電腦偵探

大量需處理的金融交易是一個很重的負擔,特别是在大資料領域。但機器學習就是建立在堆積如山的資料上的,更多的資訊會增加算法的準确性,幫助消除誤報。合法的交易也會引發的可疑交易的誤報,(例如,一個卡在一個不常使用的位置)。太多的警報和沒有警報一樣糟糕。

這樣龐大的資料需要大量的計算能力。例如,貝寶(Paypal)無時無刻都在為其1.69億的客戶處理超過1.1 pb的資料。這些大量的資料——1 pb相當于超過20萬張dvd的記憶體——這對算法的機器學習有積極影響,但也會對一個組織的計算基礎設施産生很大負擔。

這時就需要雲計算了。遠端計算資源可以在這裡發揮着重要的作用。雲計算是可伸縮的,而不會受限于公司自己的計算能力。

欺詐檢測是“正義”與“邪惡”之間的軍備競賽。目前,“正義”一方似乎取得很大進展,在技術晶片等方面取得創新,同時還結合加密功能,機器學習,大資料。當然,還有雲計算。

而騙子肯定會繼續試圖取勝和挑戰欺詐檢測系統的極限。劇烈變化的支付模式本身是另一個障礙。你的手機現在能夠存儲信用卡資訊,可以用來無線支付,而這将會引入新的漏洞。幸運的是,目前的欺詐檢測技術并不受制于支付系統技術。

本文轉自d1net(轉載)

下一篇: iptables