天天看點

螞蟻智能化中台:驅動業務高速發展的飛輪

在金融科技行業,智能中台已經成為提升業務創新能力的重要支撐,正不斷以資料資産驅動業務創新,全方位、多角度地重塑産業鍊。

“你敢付、我敢賠”和大促秒殺的背後,是數字化支付平台利用圖資料庫和虛拟化引擎的開放計算架構,是計算存儲效率的極緻優化,是端到端智能化中台的建構。

螞蟻集團計算存儲首席架構師何昌華(蕭河)先生,在最近結束的2021阿裡雲金融資料智能峰會上發表名為《螞蟻智能化中台建設的實踐與展望》的演講。講述了支付寶“大促秒殺”和“你敢付、我敢賠”背後的技術底蘊,分享端到端的智能中台如何在提升業務靈活性的同時兼顧金融風控。

螞蟻智能化中台:驅動業務高速發展的飛輪

以下為他的演講全文:

01“大促秒殺”背後的高性能賬務資料庫

螞蟻脫胎于支付寶,是從支付業務開始的。随着網際網路的發展,交易規模急速增加,這對系統背後的計算能力産生了很大的挑戰。此前,通過分布式的資料庫和服務解決了資料和計算規模化的問題,支撐起了螞蟻的業務規模。然而近兩年,直播帶貨等網際網路商業模式開始興起,出現了大促秒殺等支付場景。在這些支付場景中,買家都是跟同一個賬号進行交易,這就使得系統需要在同一個賬号上進行高頻操作,産生了熱點賬戶問題。

傳統的解決方案是削峰填谷,即指同一個賬戶接收到交易請求後進行記賬,如果是在單機能夠處理的能力範圍以内就直接記,否則加入緩存隊列,等賬戶空閑時再實作完整的一緻性處理。這個方案存在以下問題:

  • 無法精準對賬戶配置緩存隊列
  • 賬務緩存有可能超出賬戶本身餘額,出現資金損失等風險
    螞蟻智能化中台:驅動業務高速發展的飛輪

為了系統性地解決這些問題,螞蟻進行了突破性創新,設計研發了高性能賬務資料庫。

  • 賬務邏輯下沉:餘額檢查及轉賬邏輯下沉,減少應用事務
  • 無鎖一緻性:單賬戶處理在單核CPU按照網絡順序執行指令,無鎖一緻性保證
  • 網絡、存儲IO優化:減少10倍延遲,針對硬體特性編寫,底層代碼及庫函數使用C及彙編,微秒級資料通路

這一資料庫最終實作熱點賬戶處理2萬TPS。從業務發展的角度考慮,其實2萬這個數值,仍然不是特别保險,是以在這一塊螞蟻有一個更高的目标,我們希望可以達到實體極限。

螞蟻智能化中台:驅動業務高速發展的飛輪

02

虛拟化引擎保障複雜支付網絡

如下圖所示,在支付場景裡還涉及支付工具和支付管道的選擇,這需要考慮支付管道本身容量是否足夠、是否健康等各類合規要求,是典型的大資料實時決策問題。

舉個例子,2020年某省的支付鍊路由于光纖被挖斷,導緻支付管道很多名額都發生了異常,業務需要分析資料定位

螞蟻智能化中台:驅動業務高速發展的飛輪

異常原因,盡快調整支付鍊路,遇到了如下挑戰:

  • 異常分析下鑽次元受限制,次元多,無法實時任意次元互動式分析
  • 離線名額實時化需二次開發,無法複用已有離線任務
  • 單引擎性能受限,長時間視窗實時名額無法通過單流作業計算,需手工拆分成流和批作業的組合

為了解決這些問題,螞蟻内部建立了一整套全網監控的名額體系,通過流批協同、虛拟化和自動優化,建立分布式結構化存儲引擎。這一虛拟化引擎實作了任意次元下鑽、名額一鍵實時化和長時間視窗的名額自動完成計算,進而保證了支付鍊路的安全穩定。

螞蟻智能化中台:驅動業務高速發展的飛輪

03 

持續政策智能化“你敢付,我敢賠”

支付業務中,除了支付行為本身,另一個重要的課題就是伴随着支付行為的風險控制,螞蟻在這方面也做了很多工作,針對近年高發的未成年人詐騙場景,采用了智能政策方案。通過分析資料自動産生特征,組合不同的特征和門檻值自動産生政策,然後推薦給政策專家進行評估,最後上線。

螞蟻智能化中台:驅動業務高速發展的飛輪

分享一個詐騙執行個體:付款賬戶年齡大于28,在過去很短時間内有幾筆付款碼重新整理的行為,收款賬戶存在一定的交易失敗記錄。這看起來是很正常的,政策專家也很難想到要設定這樣的規則,但通過智能化的資料挖掘,發現這是一個被詐騙的賬戶。執果索因,在未成年人詐騙場景中,小朋友可能在不法分子的影響下,打開父母的付款碼截圖發送出去,由于操作不熟練産生多次重新整理行為,同時付款碼具有時效性,不法分子賬戶就容易發生多次交易失敗的情形,在短期累積一定交易失敗金額。這些看似不經意的東西,政策專家是較難發現的,系統則可以借助智能化的手段找到并确定合理的門檻值。整個智能政策系統具有較好的金融屬性:

  • 政策生成過程強可控:機器智能推薦,專家經驗精确調節,結果具備強可解釋性
  • 智能化政策組合快速響應:分布式算法執行支援政策快速且智能的探索,支援十億量級以上大資料小時内完成挖掘規則
  • 評估名額多樣,支援多目标學習,自定義評估名額

目前在螞蟻所做的工作裡,已經可以做到特征自動發現,政策智能生成并且可解釋。未來我們希望從自動特征,智能政策,到模型可解釋和歸因分析,整體是一套閉環、自動化的系統,端到端地實作智能化特征和政策選擇。這樣一個大的閉環其實需要的算力無比巨大,整個狀态空間是爆炸型的,對于這方面我們仍然在探索。

04 

全棧圖計算體系深挖資料關聯價值

随着業務和技術的的不斷發展,智能中台對于資料的挖掘也從線性結構走向圖結構。比如支付風控中的反洗錢場景,目前反洗錢主要的挑戰在于,不法分子通過“跑分平台”,租借合法賬戶,使得大量原有正常賬戶參與到黑灰産交易中。同時,他們通過海量交易、藝術品拍賣等手段來掩蓋洗錢行為,采用多重身份、大量賬号等方式來避開可疑規則篩查。這就對遏制反洗錢行為的時效性和精準性提出了很高的要求。

最初的做法是,針對單個記錄或單個賬戶進行分析,找到高危特征,設計政策和模型,判斷是否是洗錢賬戶。但是目前,研究單個賬戶已經解決不了問題,必須在一個更大更全局的範圍内研究所有賬戶的連接配接情況以及交易資金的流轉情況才有可能判斷出風險。是以,圖計算,圖存儲,圖機器學習成為了解決這一問題的強大武器。螞蟻在這方面做了非常大的投入。目前,在反洗錢領域,圖計算覆寫支付寶全部資金交易,對疑似團夥類犯罪風險識别能力提高94倍以上,風險審理分析效率提升90%。

螞蟻智能化中台:驅動業務高速發展的飛輪

螞蟻在圖計算這個領域沉澱了接近5年,現在将圖資料庫、圖計算、圖神經網絡模型等一系列圍繞着圖資料展開,對圖資料進行存儲、分析、演化的智能技術體系的能力整合起來,打造了一個産品GeaGraph。GeaGraph具備着世界領先的圖技術能力。

  • 擁有着世界規模領先的圖資料庫叢集:
  • 圖資料庫性能基準測試世界紀錄保持者,領先第二名7.6倍
  • 具備線上(領先)、近線(創新)、離線(領先)三線計算能力
  • 時序圖計算是2021金融十大科技趨勢之一
  • 基于GeaGraph的圖神經網絡模型重新整理斯坦福Open Graph Benchmark世界記錄

    05

    智能中台助力業務“自動駕駛”

整體來看,螞蟻智能中台在業務和技術的不斷發展中,漸漸沉澱出螞蟻計算存儲的大底盤。

未來,我們希望打造一個端到端的智能化中台,既有資料和特征的研發,也有政策和模型的訓練,既有具備金融特色的運籌優化求解,又有模型的模拟仿真和驗證,還能對生成的模型進行解釋和歸因。最後獲得回報,不斷疊代優化。我們希望把這樣一個閉環打通,實作資料的智能實時決策。到那時,就能夠實作金融業務的“自動駕駛“,進而助力業務飛速發展。我相信,這也應該是整個金融科技行業演進的大方向。

金融行業一直是科技的領跑者,讓科技的力量賦能金融行業發展,讓金融業務驅動技術的創新。

謝謝大家!

螞蟻智能化中台:驅動業務高速發展的飛輪

(作者介紹)