天天看點

網絡安全:步入與AI結合新時代

網絡安全:步入與AI結合新時代

在 2020 支付寶合作夥伴大會上,已有 12 億使用者的支付寶宣布轉型數字生活開放平台。海量使用者,還要對外開放,在這背後,需要極強的安全風控能力。但一般人不知道的是,如此重大艱巨的任務背後,也有着曆屆應屆生的功勞。

應屆生如何參與支付寶安全風控的核心研發?我們找到了支付寶安全部門的資深技術專家王維強,請他給我們做一下介紹。

支付寶安全團隊的資料大牛們

随着時代發展,業務安全風控逐漸走入人工智能時代,支付寶安全團隊就招募了幾位 Kaggle Grandmaster。

Kaggle 是安東尼·高德布盧姆(Anthony Goldbloom)2010 年在墨爾本創立的,主要為開發商和資料科學家提供舉辦機器學習競賽、托管資料庫、編寫和分享代碼的平台。該平台已經吸引了超過 100 萬名資料科學家的關注,可以說是資料科學行業最大的交流平台。

Kaggle Grandmaster 是在 Kaggle Competitions 平台上舉辦的比賽中,連續取得非常優異的成績才會獲得的頭銜,可以說是資料科學方面萬裡挑一的頂級高手。目前,Kaggle 隻有 180 位 Grandmaster。

支付寶安全團隊近幾年陸續招募了三位 Kaggle Grandmaster,他們的強項各不一樣,有的擅長對結構化資料進行特征挖掘,有的對圖像檢測識别非常精通,還有的對 NLP、深度文本挖掘方面很有研究。

崔世文就是其中的一位,在 2019 年,他和螞蟻的其它幾個小夥伴們組隊,利用業餘時間在 KDD Cup 2019 Regular ML Track 全球競賽中獲得冠軍,這項比賽被譽為資料挖掘界的奧林匹克。

網絡安全:步入與AI結合新時代

除此之外,團隊在過去兩年的螞蟻資料挖掘内部賽中連續獲得冠軍。也更是在專業賽道比如 CCL 2019 中國法研杯比賽,獲得了總分第一。

說起如何找到這些高手,王維強直言是機緣巧合。原來團隊裡有同學在 Kaggle平台上參加比賽交流,通過選手之間的交流知道了圈内的牛人,而支付寶安全團隊也剛好需要這個領域的高手加入,于是伸出了橄榄枝。

對于這些資料大牛來說,選擇是雙向的,他們并不缺乏工作機會,但很多人希望能夠有一個較好的平台能夠一展所長,或者身邊有牛人可以互相交流學習。

支付寶安全團隊的業務非常有挑戰性,團隊擁有資料科學領域各個方面的人才,橫向學習的氛圍很濃。也正是這些原因,讓這些大牛心甘情願的加入團隊。其中還有一位同學拒掉了外部的高薪 offer 來到螞蟻,因為短期利益不如長期價值。

另外,他們也認可支付寶安全團隊所做的事情,認可支付寶對于使用者和社會的價值,認同支付寶做事情簡單的價值觀,跟一群有情有義的人去做一些有意義的事情。

做安全為何要這麼多資料人才

支付寶安全團隊需要保護 12 億使用者的賬戶和資金安全,責任重大,那麼他們具體需要做哪些事情呢?

業務上來講,安全團隊需要負責建設和維護支付寶賬号體系、資金交易、商家服務的一整套業務安全防控機制。比如使用者的賬号是不是被盜了,某筆交易是不是被詐騙了,交易是否用于違規違禁用途如賭博等,還有如商家行為違反監管規定等,這些都會對支付寶的使用者和資金造成風險,這些風險的管控就是大安全所做的事情。

在與黑産和羊毛黨對抗的過程中,雙方的技術都在不斷更新,業務安全風控也必須應用最新的技術。随着機器學習開始在資料科學領域大放異彩,做安全的同學也開始利用人工智能來保護業務安全。

具體的手段包括,通過機器學習的算法和模型、與安全政策一起,通過資料挖掘來做風險識别和風險管控,另外也會會涉及到決策優化。

這裡面的技術包括資料挖掘、機器學習、決策優化等等。機器學習很廣泛,像裡邊的內建樹模型,深度學習中的深度文本挖掘,圖像識别,運籌優化,強化學習,對抗機器學習等,在支付寶的安全風控中都會使用到。

至于未來安全風控領域未來的技術趨勢,王維強目前比較關注這些方向:模型可解釋性,知識推理、圖計算、決策優化等。首先模型可解釋性,機器學習算法在業務安全落地對可解釋性要求是非常高的,完全黑盒的模型可能造成不可預料的後果,這在業務安全上不可接受;其次是知識推理,前些年的機器學習通過學習做判斷或預測,但推理比較少,從學習到推理是人工智能下一步的方向;然後是圖計算,過去在解決業務問題時,對關系的描述還是靠人工經驗,做安全需要對關系進行精細化刻畫,因為需要在上億的使用者裡和極少數黑産進行對抗;最後則是決策優化,這說的是更好的平衡使用者的風險和安全感體驗,避免隻強調安全而破壞使用者的體驗,而這裡面要做到一個什麼樣的程度,就是決策優化需要做的事情,對一個決策來說需要從很多角度去平衡。

總體上來講,業務安全風控的未來将會更智能化。一方面在基礎技術上,人工智能需要從學習到推理,再發展到強人工智能,才能應對更多更複雜的場景;另一方面,在安全風控場景中,我們需要更精準的去描繪更複雜的關系,進而更好的調整和應對,而這離不開 AI 的助力。

安全團隊需要什麼樣的應屆生

除了上面那些競賽大牛外,還有不少校招應屆生在支付寶安全團隊大展拳腳。

比如,算法工程師王寶坤就是校招進來的,他來自複旦大學,2018 年碩士畢業後加入團隊。他負責的是圖計算、圖表征等比較前沿的方向,因為在大學的實驗室裡也是做這個方向,是以積累很深,加入團隊後很快的了解業務,主動提議用圖計算做團夥挖掘的場景,并取得了很好的成果。

王維強介紹說,他們希望招募到研究型 + 業務型的綜合性人才。一方面,希望新人在機器學習和大資料分析等方面有比較深入的技術積累,對技術吃的比較透,因為團隊做的是沒人做過的事情,在業界也屬于前沿,是以沒有參考,不能套用别人的方案,别人的算法也不能拿來就用,必須要根據業務做相應的創新,而這隻有對技術十分了解才能做到。

另一方面,因為安全團隊是業務部門裡的技術團隊,市場形勢複雜多變,業務也随之而快速變化,隻有非常快的消化技術并了解業務,才能找到風險類型的算法落地的方案,然後把這些新的技術落地到業務裡,才能拿到結果。

是以,在校生如果今後想從事業務安全風控行業的話,建議深鑽技術,在掌握學校裡的技術基礎課程的同時,也可以去了解目前大資料和機器學習的主流和前沿技術。在實習或者做項目時,要多問幾個為什麼,一方面通過了解項目背景進而更好的了解業務,另一方面了解所使用的技術背後的原理,而不是知其然而不知是以然。

繼續閱讀