引言
阿裡巴巴安全部資料與算法團隊一直緻力于與黑灰産進行對抗,保障使用者在淘寶、天貓、閑魚等阿裡巴巴相關平台上的使用體驗和切身利益。面對狡猾的黑灰産,我們也研究出了一系列的算法武器,圖神經網絡(GNN)是其中重要的防控技術之一。GNN作為近年來新興的技術,不僅能考慮節點本身的屬性,還能同時考慮到網絡結構特征,進而刻畫黑灰産的關系、團夥以及産業鍊資訊,在風控場景中取得了廣泛的應用和效果增益。
将各種GNN模型應用到阿裡巴巴風控場景中複雜且巨大的圖結構上,是一件十分有挑戰的事情,我們面臨的圖結構往往有着以下兩個特點:
• 高度異構:節點和邊都豐富多樣
• 資料規模巨大:很多圖結構都是億級節點、數十億甚至上百億的邊
業務場景
為了應對複雜且超大規模的圖資料結構,我們和計算平台PAI團隊以及搜尋推薦事業部合作,共同開發了超大規模分布式圖神經網絡架構 graph-learn(原AliGraph),并将graph-learn應用在安全防控的各個環節之中,取得了良好的效果,下面重點介紹幾個GNN的風控落地場景。
垃圾注冊識别
淘寶每天新注冊的使用者中,正常使用者占絕大多數,但也有許多黑灰産使用者僞裝成正常使用者,企圖擷取一個賬号進而進行刷單、垃圾評論等等活動,我們稱這些賬戶為“垃圾賬戶”。“垃圾賬戶”如果注冊通過,就可能從事各種危害活動,是以在注冊時将其識别并删除非常有必要。我們通過手機号,裝置資訊,ip位址等多種關系建構賬戶與賬戶之間的連接配接關系,基于 graph-learn 建構賬戶和賬戶之間的同構圖以刻畫賬戶的新表征,垃圾注冊圖模型目前線上已穩定運作近1年,相比于單純使用賬戶的特征,每日額外識别10-15%的垃圾賬号,保持着相當高的識别準确率。
淘系假貨識别
阿裡巴巴對于知識産權的保護一直都在進行大量的努力,也取得了十分顯著的成果。但是仍然有極少部分賣家在淘寶上售賣假貨商品,這一直是我們深惡痛絕的。為此,除了應用假貨商品本身的特征以外,我們仔細甄别了假貨商品和售假賣家之間的多種關系,比如售假賣家之間的團夥關系,物流等産業鍊關系,并且通過這些關系建構商家-商品之間的異構圖,基于graph-learn開發的淘寶假貨圖模型目前已在服飾類、鞋類、首飾等諸多大類中落地,相比于直接使用商品、商家的特征資訊,圖模型能夠額外識别10%以上的假貨商品。
閑魚垃圾評論識别
閑魚是目前國内最大的二手商品交易平台,買賣家可以在商品下面評論進行溝通和詢問,但其中也有黑灰産會在商品下面留下一些涉嫌廣告、欺詐、假貨甚至違禁的評論,影響了使用者的使用體驗,也給使用者帶來了風險。為了識别閑魚上的垃圾評論,我們結合業務特點,自主設計了基于異構圖卷積網絡的反垃圾系統-GAS,相對于單節點的深度模型,能夠在同樣準确率情況下獲得16%的覆寫率提升,同時我們将該項目中的方法進行總結,所著文章《Spam Review Detection with Graph Convolutional Networks》發表在資訊檢索領域頂級會議CIKM2019上,并斬獲最佳應用論文獎。

惡意評價識别
惡意評價包括評價要挾,同行攻擊和虛假評價等多種類型,在淘寶平台上一直是困擾商家的主要問題之一。和傳統圖模型相比,異構圖神經網絡通過聚合不同子圖的方式消除主觀上對強弱邊的判斷,能夠通過圖間融合的方式融合不同強度的邊資訊。在淘系惡意評價的場景上,基于graph-learn 開發的惡意評價圖模型優化了整體資料準備流程,提高訓練效率,上線後已穩定運作近半年,日均額外識别7%以上的惡意評價,優化了商家的營商體驗。
“職業吃貨”行為識别
淘寶平台上還有一部分“職業吃貨”存在,他們在淘寶、餓了嗎等平台瘋狂下單,收貨後卻立即申請“僅退款”而拒不退貨,繼而以職業投訴等方式威逼商家妥協,這就是典型的“職業吃貨”行為。對這種濫用淘寶會員權利,損害平台正常營運秩序的人,我們通過各種媒介關系基于graph-learn建構“職業吃貨”圖模型,相對于GBDT的傳統模型,“職業吃貨”圖模型在相同準确率的情況下,額外識别了15%的惡意買家,保障了商家在平台上的權益。
風控領域的應用很廣闊,阿裡也希望有更多關注圖神經網絡、自監督學習或其他算法方向的人才能共同探索這些技術在風控場景中的應用。如果你有至少一篇高品質機器學習算法一作論文,在圖卷積網絡和自監督深度學習有深入研究或非常感興趣,阿裡現在也招聘實習生和正式研究者(三年以上 ML 經驗),感興趣的讀者可聯系 [email protected]。
開源項目位址:
https://github.com/alibaba/graph-learn本文作者:秦州