人工智能時代,存在的最大問題是是魚和熊掌不可兼得,也就是隐私性和可用性難以兼顧。如果你想要AI本身系統發揮作用,就可能要先犧牲隐私,但在大量的真實場景當中,如果不能同時兼顧到隐私性和可用性,會導緻很多AI落地的困境。
比如舉一個貸款風控的例子。如果使用者想要去銀行做貸款,先來到了銀行A,銀行A基于一些本地資料判斷這個A是一個壞人,我們不可以給他貸款,這個人就到了銀行B,但是銀行B沒有銀行A的這些資料,是以銀行B也許會把這筆貸款發放給使用者本人。這些由資料不流通所導緻的沖突比比皆是。
為了解決這一問題,國内外不少科技公司先後推出了解決方案,比如谷歌推出的聯邦學習、螞蟻金服提出的共享智能等。
共享智能為什麼能夠獲得産學研各界的廣泛關注?
近年來,随着隐私保護越來越受重視,相關法規逐漸出台,網際網路公司難以任意的獲得資料;但在另一方面,基于大資料的人工智能需要更多更完善的資料才能發揮更大的作用。就像上面所提到的例子一樣,如何在保護隐私和資料安全的前提下,聯合多方資料進行AI訓練和分析,成為學術界和産業界的研發熱點。
螞蟻共享智能作為一個新興的交叉學科,近些年獲得了學術界、産業界以及研究機構的廣泛關注。資料已經是一種生産要素,重要性不言而喻。資料不僅是各類大資料應用的基礎;資料的品質和數量也已經成為影響人工智能模型效果最重要的因素之一。當今各種應用産生并收集了大量的資料,同時也是使用資料的大戶。随着AI模型能力和算力的提升,各種應用場景對各種異構、異源資料的使用效率也在飛速提升。
然而,資料的廣泛使用在提升應用效果的同時也引發了我們對于資料安全性的擔憂。這主要是歸結于資料自身的兩個很重要的特性:一個是可複制性,一個是可複用性。可複制是指,資料可以被完整的、極低成本的拷貝;可複用性是指,某份資料可以被多個不同領域的場景複用,也可以在相對長的一個時間軸上被複用。
是以如果不同應用之間直接共享資料,那麼可複制性和可複用性,一定會導緻資料洩露的情況,也就是被留存二次使用,進而侵犯了商業利益。更為嚴重的是,如果是個人相關的資料,很多時候,資料的管理者和使用者并不是資料的所有者。一旦在資料共享的過程中,發生了資料洩露,被對方濫用,那資料的管理者不僅僅是商業利益受到侵犯,它很可能也沒有盡到資料管理的責任。從歐盟的GDPR開始,到美國CCPA,到中國的資料安全法、網絡安全法、個人資訊保護法都對這種資料管理失責,和資料濫用,提出了嚴格的規範。是以各大資料方,出于保護商業利益、法律風險、輿論風險各方面考慮,都在收緊資料共享,進而形成了大資料孤島。
螞蟻共享智能就是為解決資料協作需求與隐私洩露和資料濫用之間沖突的技術解決方案,不直接共享資料的情況下,連通大資料孤島,實作多方資料可用不可得,也就是拿不走,看不見,但是用得好。
共享智能憑什麼可以成為國際标準?
早在2016年,螞蟻就開始緻力于共享智能的技術研發,并在螞蟻内部及合作夥伴方的智能信貸、智能風控等業務領域中率先應用。螞蟻共享智能具有以下特點:
(1)多種安全計算引擎整合,可基于不同業務場景來選擇合适的安全技術。既有基于TEE的集中式解決方案,也有基于MPC的分布式解決方案;既可滿足資料水準切分的場景,也能解決資料垂直切分的訴求;既可以做模型的訓練預測,也可以做資料的探查和分析。
(2)支援基于SQL文法的資料分析、各種資料預處理算子和多種機器學習算法。支援的算法包括但不限于LR,GBDT,Xgboost,DNN,CNN,RNN,GNN等。
(3)大規模叢集化。支援大規模叢集化,提供金融級的高效、穩定、系統化的支撐。
值得一提的是,共享智能有四個基石性的研究方向,分别是多方安全計算,可信執行環境,差分隐私,以及聯邦學習。
多方安全計算和可信執行環境側重解決計算過程中的資料安全問題,差分隐私側重保護計算結果裡的隐私洩露,而聯邦學習擅長解決大資料孤島帶來的人工智能算法收斂性及效率問題。單獨的一個方向并不能解決多方資料可用不可得的問題,共享智能的研究既包括推動這四個基礎方向的進步,又包括對這四個方向的融合創新,進而提供滿足不同實際需求的多種産品與服務。

這些技術在實踐中表現出了獨特的優勢,可以應用于不同場景。比如基于可信執行環境的方案可以做中心化部署,使用者的接入成本是比較低;而基于多方安全計算的方案,相關的安全技術對使用者來說是透明的,給使用者的安全體感強。同時,多種技術并不是隔離的,在面對一個複雜問題的時候,對技術的選型不是非此即彼的關系,把不同的技術融合到一起,發揮各自技術的優勢,往往會達到一個更為理想的效果。
不久前,螞蟻牽頭的共享智能聯盟标準就在AIIA(中國人工智能産業發展聯盟)正式釋出,這也是全國首個共享智能的聯盟标準。事實上,早在2019年,共享智能就已經亮相國際舞台。螞蟻在IEEE(電氣和電子工程師協會)、ITU-T(國際電信聯盟)中牽頭推進“共享學習技術架構和技術要求”和“共享學習系統技術架構”國際标準的制定,來解決行業痛點,讓資料在安全環境下進行連接配接、合作、共創、賦能,充分釋放多方資料價值。
共享智能技術在行業内,也獲得了一些行業獎項,展現了行業内對這一技術的認可度。2019年,在中國人工智能峰會上獲得了紫金産品創新獎,在全球人工智能創業者大會上獲得應用案例示範獎,在的世界人工智能産業安全上獲得了十大創新實踐,在CCF(中國計算機學會),獲得了科技進步優秀獎。
标準是創新也是前瞻,不僅解決目前的問題,也能解決未來的問題。作為一家緻力于為世界帶來平等普惠金融服務的科技公司,螞蟻金服一直走在國内外标準制定的前列,助力推動技術的規範化發展。
螞蟻共享智能的應用實踐
金融行業作為一個資料驅動的行業,不僅對資料的管控更嚴格,對資料的隐私保護也會更加重視,是以也是最需要通過技術手段解決資料孤島問題的行業,這也是很多技術實踐都優先選擇落地金融領域的原因。而螞蟻共享智能就憑借多年金融實踐和廣泛應用,獨樹一幟,成功幫助金融等相關行業逐漸解決隐私洩露和資料濫用的資料共享難題,為大資料在更多領域的深度應用保駕護航。
接下來分享三個典型落地案例。
一個是在安全風控領域,螞蟻基于共享智能技術将風控能力賦能合作夥伴,聯合資料模組化提升模型性能,來建立安全風控網絡。生态夥伴可以使用可信執行環境技術,把資料加密傳輸到網絡中共建這個模型,打擊虛假交易、團夥作案等,大幅度提升風控準确率,實作風控網絡的淨化。通過這樣的風控網絡平台,使得商家每天新增很多的交易,同時降低資損。
第二個是中和農信,螞蟻通過資料融合大幅度提高風控性能,把原來傳統的線下模式,變成線上自動過審模式,完成授信隻需5分鐘,8個月累計放款31.9億,授信成功人數44萬人,業務覆寫20+省區,300+縣城,10000+個鄉村,助力實作農村普惠金融。
第三個是與江蘇銀行建立信貸聯合風控機制,通過共享智能技術,建構共同的模型強化風控管理,讓信貸防控的效果進一步提升。基于聯合風控機制,江蘇銀行能夠在獲得貸款申請後,通過資料互動,依據多方資料進行更科學的信貸決策,在這個過程中,使用者的資料和隐私也得到了有效的保護。在螞蟻共享智能等前沿技術加持下,江蘇銀行通過聯合風控系統,提升綜合服務、智慧風控能力,破解信貸難題,在實作風險抵禦能力增強的同時,推動業務穩步增長,資産品質持續改善。
總的來說,螞蟻希望建構開放的共享智能網絡,有更多的夥伴、機構參與進來,一起完成建設,打破資料孤島,助力AI技術更好地落地和應用。