天天看點

聚焦AI最前沿 螞蟻金服2019年頂會參與回顧緊抓核心技術能力 持續沉澱基礎研究應用成果提高AI落地服務水準 以技術創新推動普惠金融

2019年,是人工智能與機器學習技術快速發展的一年。對于螞蟻金服而言,過去一年的人工智能技術、産品、解決方案及研究成果已經在 NeurIPS、KDD、ICML、SIGMOD、SIGIR 等各大國際頂會上陸續亮相,為學界帶來了諸多來自實際業務場景的創新研究和應用分享。

正如《哈佛商業評論》2020一月刊裡文章提到:螞蟻金服所服務的客戶數量是美國最大銀行的10倍多,員工數量卻不到其十分之一。不同于傳統金融機構,螞蟻金服所提供的消費信貸、貨币基金、财富管理、醫療保險、信用評級,甚至是螞蟻森林等各種各樣的服務,其關鍵路徑均是“無人工”的模式,進而使得業務能夠實作快速增長與突破,而這主要得益于背後的人工智能技術與海量的支付寶資料,“AI runs the show”。

緊抓核心技術能力 持續沉澱基礎研究應用成果

在人工智能領域,過去一年螞蟻金服相繼在 NeurIPS、ICML、ICLR、AAAI、IJCAI、SIGIR、NAACL、VLDB、ACM T-IST、KDD、CVPR 等全球頂級學術會議和期刊發表多篇論文成果,涵蓋計算機視覺、NLP、機器學習等領域,并在大型分布式機器學習、強化學習、圖機器學習、無監督學習、資料挖掘等方向均取得突破,這些技術在解決金融場景複雜動态網絡、對抗性、魯棒性、安全性、外部性風險與資訊不完備性、實時性等問題上均發揮了重要作用。

比如在2019年6月的 ICML 會議(International Conference on Machine Learning,即國際機器學習大會)上,支付寶AI技術團隊即貢獻了多篇前沿論文研究成果。包括提出了用生成對抗使用者模型來解決強化學習小樣本的問題,并将此方法用于優化推薦系統;提出粒子流貝葉斯定理(particle flow Bayes'Rule)算法,實作對高維貝葉斯推理的精确度和計算效率的提升優化等等。

聚焦AI最前沿 螞蟻金服2019年頂會參與回顧緊抓核心技術能力 持續沉澱基礎研究應用成果提高AI落地服務水準 以技術創新推動普惠金融

在支付寶業務資金鍊路和運力優化等場景會涉及組合優化和整數規劃問題,車輛路徑規劃作為該類問題的經典場景,支付寶AI團隊提出一套新的 CVRP 算法進行求解(ICLR2020),能夠有效發揮機器學習和傳統運籌優化各自長處,對比 Google OR-tools提升了10%,并優于 FAIR,Google 以及各種AI頂會的結果。

為了提升AI模型在金融業務場景的安全性和魯棒性,支付寶AI團隊通過深度對抗學習等相關技術打造了體系化的解決方案。例如借助于動态網絡中可解釋的分層信道選擇,顯式地将網絡決策路徑可視化,并提出了一種對抗性執行個體檢測算法(AAAI 2019),該方法能夠獲得更高的預測精度,并顯著提高多個攻擊的檢測率。而面對支付金融場景對模型魯棒性的要求,首創了三種可顯著降低一些圖神經網絡模型效果的攻擊手段(ICML 2018):基于層次強化學習的攻擊、基于遺傳算法的攻擊和基于梯度的攻擊。并提出針對性的對抗訓練方法,進而提升模型的魯棒性和安全性。

同時,為了更高效提取特征,支付寶AI團隊開發了 SAFE: Scalable Automatic Feature Engineering Framework for Industrial Tasks (ICDE 2020),進而滿足金融場景下對高适用性、分布式計算與實時推理的強需求。

由于金融市場天然具備的外部性風險與資訊不完備性,螞蟻金服在博弈論與多智能體等前沿技術上也在持續投入研究與應用探索。包括提出了 Double Neural Counterfactual Regret Minimization 計算架構(ICLR 2020,以第一機關論文發表),使得CFR可求解超大規模非完全資訊博弈IIG問題,同時提出了 mini-batch robust sampling 算法,使得 Monte Carlo CFR 算法收斂速度大幅提升,在雙人非限制性德州撲克遊戲中,該算法可以收斂到與傳統 CFR 算法相似的結果,而存儲空間卻不到其200分之一;另外還提出了一種比 Discounted CFR 更快收斂的CFR算法,在非限制性德州撲克中,該算法比 DeepStack 中的 Hybrid CFR 算法收斂速度快兩倍。

金融市場通常面臨複雜動态網絡裡的多智能體問題,螞蟻金服創新性提出 value propagation 算法用以解決多智能體問題。具體而言,該算法去中心化訓練和去中心化執行場景中 multi-agent reinforcement learning 的值函數傳播問題。該方法可用于解決目前多智能體問題面臨的諸多挑戰:比如多個 agent 如何在隻觀測到自己獎勵函數的情況下學會合作,以及 multi-agent reinforcement learning 算法的收斂性等。在資金優化和交通控制等業務場景中該算法有着廣闊的應用場景。

深度學習面臨的一大挑戰是如何在了解的基礎上做推理。在 NLP 裡的推理問題上,近日螞蟻金服的一項工作超越其他科技公司登頂數字離散推理 DROP 榜單。DROP 與傳統 MRC 資料集的主要差別在于需要根據問題和上下文做數字邏輯推理才能得出正确答案。主要方法是通過建構數字、日期等常識符号圖譜,并基于 GCN 建圖,使用 Hard-EM 算法對推理表達式的隐變量進行疊代學習。此外,如何處理海量資訊、提升服務效率也已成為國際頂會重點關注話題,在展示資訊檢索領域 SIGIR 2019 頂會上,支付寶AI團隊提出利用強化學習預測使用者意圖,實作“未問先答”的功能。

這些智能服務背後,少不了螞蟻金服自主研發的金融級分布式關系資料庫 OceanBase 的支撐。在2019年最新釋出的 TPC-C 測試排行榜中,OceanBase 超越 Oracle 榮登榜首。目前,除了支援螞蟻金服自有業務、阿裡巴巴集團雙十一的流量考驗以外,還支援着數十家金融機構的業務。

可以說,國際頂會上諸多基礎研究與應用創新成果分享,讓螞蟻金服成為全球學界和工業界不可忽視的力量。而基于螞蟻金服十五年演進并全面對外開放的“BASIC”技術體系,更多基礎研究應用成果因為也将逐漸在産業應用中落地。

提高AI落地服務水準 以技術創新推動普惠金融

實際上,頂級學術會議交流的火熱,一方面可推進基礎技術最前沿研究的發展,将學術研究與應用相結合,另一方面可推進前沿技術在實際應用中落地,為使用者帶來價值。正如此前螞蟻金服副總裁及首席AI科學家漆遠所表示的,“發展和使用人工智能技術,我們能夠為螞蟻金服全球超過12億的使用者解決真正的問題,提供真正有意義的服務。”

比如早在2005年,支付寶便率先推出“你敢付,我敢賠”,承諾如果賬戶被盜全額賠付。2019年,支付寶又将其更新為“秒賠”+“先賠”:使用者的投訴如果經AI确定,賠付能秒到賬;如果案件存疑,也會先賠再說。在此背後,正是支付寶安全團隊在 KDD CUP 2019 大賽上獲得全球第一的AI應用能力。

聚焦AI最前沿 螞蟻金服2019年頂會參與回顧緊抓核心技術能力 持續沉澱基礎研究應用成果提高AI落地服務水準 以技術創新推動普惠金融

基于豐富的人工智能技術應用場景,目前螞蟻金服已經沉澱了業界領先的分布式機器學習平台支援大規模深度圖算法、線上學習、共享學習、強化學習等能力,以及金融視覺、金融知識圖譜、機器人平台、NLP平台等通用能力。

以大規模深度圖算法的應用實踐為例,面對金融場景可解釋性的要求,螞蟻金服在 AAAI 2019 的多篇論文中介紹了如何在圖機器學習過程中引入了 attention 機制來學習不同廣度/深度鄰居的重要性,以及異質資訊的重要性。這些算法不僅為不同類型圖資料提供更強大的表達學習能力,同時也提供不同層次的可解釋性,目前已應用于智能營銷、信用風險、安全風控等多個支付金融場景,極大降低了産品營運成本和欺詐資損進而提高業務收入。

而在2019年關于機器學習和計算神經科學的國際會議——NeurIPS(全稱神經資訊處理系統大會)上,螞蟻金服也有多篇論文入選,聚焦 GAN、GNN、深度強化學習等課題。在 NeurIPS 2019 展台現場還展出了基于圖像識别、環保知識圖譜等技術的智能垃圾分類小程式和智能回收箱視訊,觀衆可通過手機拍照輕松識别垃圾物品和對應的垃圾類别,現場體驗來自東方的“生活小助手”。目前,這套圖像識别技術已逐漸開放給行業夥伴。利用支付寶的海量使用者覆寫能力和城市服務的便民心智,結合 AI+IoT 技術,實作人工智能識别垃圾和分類,用科技推動個人與企業機關參與垃圾分類回收的積極性和處理效能。

聚焦AI最前沿 螞蟻金服2019年頂會參與回顧緊抓核心技術能力 持續沉澱基礎研究應用成果提高AI落地服務水準 以技術創新推動普惠金融

此外,螞蟻金服在聲紋技術方面部分工作發表在國際語音頂會 IEEE ASRU 2019。在獲得同行評審專家的高度認可的同時,該創新技術已經在支付寶 APP 無線端聲紋業務落地,有效提高了安全性和使用者體驗。

随着研究發展、頂會的大熱,AI、區塊鍊、計算系統等原本看起來“隻可遠觀”的技術已不斷獲得突破,實實在在地為我們的生活服務帶來改變。2019年已經翻篇,螞蟻金服AI研究的步伐也逐漸加快,AI技術落地服務水準迅速提高,通過技術創新和科技開放更好地推動普惠金融發展,帶來更加美好的智能生活。

繼續閱讀