天天看點

算法周刊·專訪|新科院士蔣昌俊:在防控網絡支付風險中做到“以不變應萬變”

作者:澎湃新聞

澎湃新聞記者 邵文

如何防控網絡支付風險?尤其是在 “雙十一”零點這樣的尖峰時刻,電子支付平台不僅要處理超過五十萬筆/秒的洪峰般交易,更要保障安全。要迅速辨識出躲在交易背後盜用他人賬号的“黑手”,可謂難上加難。

對此,中國工程院院士蔣昌俊在近日舉行的“上海人工智能大講堂”上接受澎湃新聞(www.thepaper.cn)記者專訪時表示, 網絡交易中騙子的騙術各種各樣,而且會不斷更新,不過監管者如果能夠盯着正常使用者的正常行為,抓住這個規律識别異常就能做到以不變應萬變。”

蔣昌俊在2021年當選資訊與電子工程學部院士。蔣昌俊長期緻力于網絡金融安全研究,是大陸該領域帶頭人。他建立了并發系統行為理論,攻克了交易風險防控瞬時精準辨識的重大技術難題,主持建立了大陸首個網絡交易風險防控體系、系統及标準,并成功應用于網絡經濟、數字治理等多個領域。蔣昌俊現任同濟大學特聘教授,同時也是中國人工智能學會監事長、中國雲産業創新戰略聯盟副理事長。

現如今中國的網際網路交易規模龐大,中國市場已然成為全球最大的數字支付市場,網絡金融對國民經濟發展具有重大意義,這使得網絡交易的風險防控也成為國家金融安全的重要組成部分。近年來,金融欺詐、跨境洗錢、貿易逃稅等有組織、有規模的地下詐騙産業已然形成。據不完全統計,2020年大陸金融詐騙犯案人數約160萬人,金額4687億元,網絡詐騙嚴重威脅網絡金融安全。

在巨大的交易流量中,如何把惡意交易“既快又準”地辨識出來?

“難點一方面在于,以前的風控以身份認證為核心,很難甄别身份盜用和交易欺詐;另一方面,交易欺詐呈現高隐匿多變性增長趨勢,面向特定場景(比如支付)的風控技術,難以應對網絡交易跨行業組合欺詐,缺乏普适性和系統性。”蔣昌俊表示。

在上海人工智能大講堂上,蔣昌俊從如何解決網絡交易的高并發、高時效、高辨識三個特性角度,介紹了大陸首個網際網路交易風控體系建立的全過程。蔣昌俊表示,核心思想即“以不變應萬變”。

首先是網絡交易的高并發性。“我們現在看到網絡交易系統有多使用者并發通路、多業務并發操作、多程序并發處理等特點,可以概括為網絡并發系統行為,”蔣昌俊表示。而并行計算機是基于順序計算的經典計算機模型方法,像搭積木一樣搭成并行實時的過程,難以分析網絡并發的系統行為,需要建構全新的并發系統行為理論。

蔣昌俊談到,通過對并發系統行為的一些性質,包括行為相關性,一緻相關,受控相關等的分析,即可為後續并發排程和行為認證建立理論依據。

蔣昌俊為網絡并發系統的行為分析奠定了理論基礎,填補了經典的喬姆斯基層級體系所不能刻畫系統并發行為及其能級的空白。具體而言,他提出并發語言識别器的PN機模型與并發語言産生器的矢量文法,創立網絡并發系統的PN機理論,建構了刻畫并發系統行為能力的層級譜系,闡明了并發系統互動協同中的行為相關性關系。

同時,網際網路交易流量巨大,且瞬時突增。對此,蔣昌俊提出“以靜制動”政策,即以靜态業務橫切分解,制導動态資料的實時并發計算。在此基礎上,再對資料流業務網絡進行解耦,分解成最小不可分解的子網,以提高實施并發性。另外,在優化并發系統的計算環境方面,通過建立一系列雙比對的BM算法,以及時間限制下的一些排程算法等,通過動态優化配置,進而實作“高時效”。

蔣昌俊發現了網絡并發系統資料傳輸容量的性能界限,提出非均衡網絡流量優化計算方法,采用計算任務全局導向的樹型編碼模式,突破了原有網絡計算方法局部傳遞負載所導緻的平衡過程長、效率低、算法收斂速度較慢等瓶頸,實作網際網路大規模、非均衡、短時突發等的流量計算。

除了在高并發性、高時效性上解決網絡交易的安全問題,還有從使用者直接行為分析得來的網絡交易行為認證。

在網絡交易中,傳統交易認證采用單域管控的身份識别認證方式,即通過網絡安全的身份資訊、銀行賬戶的數字密碼等進行認證。然而,這些資訊極易被非法騙取,欺詐手段的多變、欺詐隐蔽性增強以及團夥跨域作案都使得這樣的方式效用有限。

如何以不變應萬變?

“以不變應萬變”:從變化的行為資料中求解不變的行為紋理

對于實作“以不變應萬變”,蔣昌俊的思路是:從變化的行為資料中求解獲得不變的行為紋理。

這也是國際上較早提出的網絡交易風險防控行為認證方法,但當時普遍采用的是詐騙後總結規則,缺乏統一設計,規則之間缺乏一緻性,效率低、準确性差,無法應對層出不窮的詐騙手段。

蔣昌俊帶領團隊另辟蹊徑,提出行為認證基礎即“行為認人”。他提出,“現實生活中,每個人的行為習慣會展現在一言一行中。網絡上也一樣,任何一個細小行為都會留下‘痕迹’,如使用的裝置、時長、頻率……久而久之形成習慣。這種習慣如同指紋一樣難以複制,具有比密碼更複雜的特點,通過深入分析這些‘痕迹’,可以對網絡交易支付使用者進行瞬時精準識别。”

“行為認人”通過整合普通消費者的資金鍊、消費方式、消費時間、消費地點等多要素、碎片化的資訊完成消費規律模組化,然後與詐騙者一次性轉移資金的異常分散規律進行比對分析,進而識别出詐騙行為。在當時應用到網絡交易平台後,這套方法就将交易識别率從44%提高到96.91%。

目前,該成果已在全球最大的第三方支付平台支付寶獲得應用,服務于全球200多個國家和地區的9億多支付寶實名使用者。“Paypal的賠付率是千分之1.9,也就是做1000塊錢要賠付1.9元,而我們是百萬分之5,”蔣昌俊表示。

蔣昌俊的團隊也與中國工商銀行、上海自貿區等機關建立了合作關系,通過融e行、自貿區企業行為風險防控技術等産品對金融系統進行安全監控管理。

到這裡可以思考一個更為宏觀的問題,AI如何切實落地場景起到實效?

蔣昌俊對澎湃新聞(www.thepaper.cn)表示,“人工智能的發展是一個長期的過程,深度學習确實解決了一些問題,但不能期待其能一下解決所有問題。還沒有達到這個程度,如果期待過高,時間久了反而會起反作用。從我的經驗來看,不如找準問題,找準對策,紮紮實實解決問題。”

AI的未來:紮根真實場景,突破基礎研究短闆

“目前,大陸在智能交通、網際網路金融、智慧醫療等領域已經取得了初步的應用成果。國内網際網路企業也紛紛規劃人工智能藍圖,比如百度的自動駕駛,阿裡的城市大腦智能交通,騰訊的醫療讀片和醫療影像資料處理,科大訊飛的語音識别;寒武紀、科大訊飛、商湯科技為代表的初創企業在技術上不斷創新;海康威視占據全球智能安防企業的第一名。這些都是大陸在AI産業中取得的實際成就。”蔣昌俊曾表示。

蔣昌俊同時指出,目前大陸人工智能産業尚未形成有影響力的生态圈和産業鍊,與美國、歐洲相比,更加集中于應用落地,但在基礎理論和原創算法方面發展薄弱,缺乏突破性、标志性研究成果,在共性技術平台、智能晶片等方面的發展也相對薄弱。

“從大陸人工智能領域發展角度講,我們很注重應用方面,但基礎研究依然是短闆,人工智能領域重大的理論和技術大都源自西方國家。基礎科學研究的特點是需要大量資源、投入周期長、不确定性大和風險高等,這決定了其難以在短期内見效,但隻有長期投入,保持耐心才能實作真正持久的創新與源源不斷的技術發展。”蔣昌俊進一步說道。

值得注意的是,“對資料的了解非常重要,”蔣昌俊對澎湃新聞(www.thepaper.cn)提到,深度學習依賴于大量喂資料,那麼要判斷它合适不合适,光從模型、算法上考慮是不夠的。“我認為讓AI能夠見效的一個很好切入點,即是對大資料有一些理論和分析方法。如果對大資料的結構特征、邊界特征和條件特征等有結論,那麼自然就知道資料的形态如何。在對資料有了深刻了解以後,在算法設計時就能更好适應及貼近資料,起到更好效果。目前有圖譜學、函數逼近論、随機分析等,但還是缺少的。”

那麼如何思考AI的未來?

蔣昌俊曾談到,傳統的AI注重從感覺到認知的過程,實作從邏輯到計算的不斷提升;而目前的AI,則是由弱到強的智能,是從閉環到開環、從确定到非定的系統。

他進一步作了解釋,“目前的神經網絡模型大都側重對資料的計算層面。事實上,一個進階的智能機器應該具有環境感覺與邏輯推理的能力。将AI的演算和計算進行融合,結合基于規則系統的推理能力和神經網絡的學習能力,即可建構一個更強大的AI模型,推理能力也可以幫助減少神經網絡學習新事物時所需的資料量。這樣的互動和融合将是目前AI由弱到強的主要突破口。”

蔣昌俊認為,在建構類腦認知模型中,目前脈沖神經網絡的神經元以電脈沖的形式對資訊進行編碼,更接近真實神經元對資訊的編碼方式,能夠很好地編碼時間資訊。而由于脈沖訓練缺乏高效的學習方法且需耗費大量算力,在性能上與深度網絡等模型還存在一定差距。“未來,兩類模型仍需要不斷從腦科學中吸取營養并不斷融合,發展性能更好、效能更高的新一代神經網絡模型。”

在被問及學會、研究機構等在AI未來發展中的角色,蔣昌俊對澎湃新聞(www.thepaper.cn)表示,無論是學會還是研究機構,本質上都在賦能企業,要做好這件事就要深入具體問題,比如隻有真正了解交易過程的場景、規律、業務特點,才能解決問題。

蔣昌俊曾談及30年科研曆程的體會,“回顧30年來的科研曆程,我深切感受到,基礎創新是破解科技難題的法寶。當今時代,科技發展日新月異,面對科技創新的挑戰,我們要更加重視基礎創新,要不斷回顧領域發展曆史,梳理演進脈絡,找準切入點,開闊思路、大膽創新、嚴謹求實,着力求解難題。”

算法周刊·專訪|新科院士蔣昌俊:在防控網絡支付風險中做到“以不變應萬變”

責任編輯:李躍群

校對:施鋆

繼續閱讀