天天看點

《個人資訊保護法》正式施行 資料互聯互通漸行漸近

作者:中國經營報

本報記者 劉穎 張榮旺 北京報道

垃圾短信、騷擾電話、垃圾郵件源源不斷、冒名辦卡透支欠款、案件事故從天而降、賬戶錢款不翼而飛……這些都是可能因為資訊洩露而造成的安全隐患。

随着《中華人民共和國個人資訊保護法》(以下簡稱《個保法》)在11月正式實施,這些問題将得到解決。與此同時,金融機構的資料共享也将進一步規範。過去一年,隐私計算技術在金融機構之間迅速普及,後者通過深度挖掘脫敏資料,持續完善自身的風控體系與精準營銷模型。

“金融機構在業務營運中積累了大量高品質、高價值的資料,但這類資料僅與金融業務相關,而一些金融服務如授信、營銷,通常需要更全面的客戶畫像。是以,金融機構有着與同業機構以及其他行業機構進行聯合計算的需求。”馬上消費金融股份有限公司(以下簡稱“馬上消費”)副總經理兼首席資訊官蔣甯對《中國經營報》記者表示,隐私計算技術的應用既挖掘了資料的潛在價值,又為資料風險控制提供了強有力的支撐。

據北京中關村科金技術有限公司(以下簡稱“中關村科金”)隐私計算方面的專家透露,國内大型國有銀行、股份制商業銀行、大資料交易所和地方大資料局等機關非常重視隐私計算技術的應用,自2019年開始相關的招标逐年增多,相關基礎設施建設正在逐漸完善中。

資料流通需求助推隐私計算發展

所謂隐私計算,主要由多方安全計算、可信執行環境、聯邦學習等技術組成,在相關個人資料不流出銀行等金融機構端的情況下,由雙方提供大量脫敏化、結構化資料,憑借各自的大資料分析能力進一步完善使用者畫像,進而助力彼此提升信貸風控與精準營銷效率。

目前,大陸數字經濟發展迅速,資料流通成為其中必不可少的關鍵環節。蔣甯表示,在傳統資料流通方式中通常進行明文資料的流通,随着資料的不斷傳播,資料安全風險也不斷提高。資料流通環節中任何一個機構出現資料洩露,都會威脅資料安全。是以,在對資料安全要求較高的金融場景下,密态資料流通無疑是更好的選擇,能夠更好地控制資料的使用和流通範圍,并保障資料安全。

對此,中國信通院雲計算與大資料研究所隐私計算研究員賈軒也指出,涉及多方敏感資料的聯合模組化過程,可以采用隐私計算技術,以“資料可用不可見”實作多方資料安全合作及價值挖掘。以多方安全計算、聯邦學習和可信執行環境為代表的隐私計算通過對原始資料加密、去辨別化或假名化處理,計算過程及結果隻傳遞經切片、密文等非原始資料,實作了原始資料不出域。因為隻傳遞資料價值,隐私計算實作了資料的持有權和使用權分離,解決了原始資料無限複制、盜用、濫用的問題,保障了原始資料持有權不變且不受損,保障了資料主體的合法權益。同時,結合特定應用場景,經隐私計算技術處理後的流通資料在一定條件下有望實作匿名化,也有助于實作對原始資料的最小化使用。

蔣甯指出,不同技術在實踐中常組合使用,在不同應用場景下強化資料安全和隐私保護。其中,多方安全計算可實作在無可信第三方的情況下,多個參與方共同進行一項計算。每一方隻能擷取自己的計算結果,無法通過計算過程推測出其他任意一方輸入的資料。在金融場景下,可應用于聯合統計、聯合查詢、聯合模組化、聯合預測等。聯邦學習是實作在各方機器學習原始資料不出庫的情況下,通過對資料的加密流通與處理來完成多方機器學習模型訓練。聯邦學習是在人工智能開發過程中,為了保障使用者隐私和資料安全而提出,是以廣泛應用于智能化金融服務場景中。可信執行環境是通過在中央處理器中建構一個安全的區域,保證區域内的程式和資料的機密性和完整性。TEE是安全隔離的執行環境,為受信任應用的運作提供了比普通作業系統更進階别的安全保障。

蔣甯指出,由于多方安全計算的技術複雜、開發難度大,是以布局這類技術路線的多為技術型企業,建設以多方安全計算為底座的資料流通基礎設施。對于聯邦學習,由于目前人工智能産業蓬勃發展,并伴随相關資料安全需求遞增,且聯邦學習有較多成熟的開源社群,開發難度相對較低,是以衆多企業投入研發基于聯邦學習的隐私計算産品。對于可信執行環境,由于對硬體的依賴及國外晶片的限制,國内相關産品相對較少,但已有一些企業在國産化硬體上進行了研發投入。

隐私計算如何幫助金融機構了解客戶消費行為、消費特征與風控重點?

在中關村科金隐私計算方面的專家看來,一切的關鍵在于模型。這裡的模型主要指機器學習模型或深度學習模型。C端客戶申請金融機構的産品或服務時,要簽訂使用者授權協定并提供必要的個人資訊。金融機構擷取到這部分資訊之後,會根據不同的場景,調用營銷類模型或風控類模型,根據模型的輸出做相關業務決策。

“這裡用到的模型,往往無法單純使用金融機構的自有資料獲得,即使能夠利用自有資料訓練獲得,其精度也難以滿足業務決策需求。這個模型往往是利用自有資料以及聯合模組化合作方的資料訓練得到的。”該專家指出,隐私計算技術可以幫助金融機構在不知道客戶敏感資訊的情況下,通過聯合模組化得到可用的模型,進而支撐業務順利的開展。

不過,該專家也表示,利用隐私計算技術訓練模型會對模型的性能有一定的損傷,但對風控的準确率不産生實質影響。按照中國清算支付協會制定的《多方安全計算金融應用評估規範 》,基于隐私計算訓練得到的模型與明文本地訓練得到的模型,精度差異不得超過5%,故而模型精度是有保障的。同時,利用模型開展風控是一個較為複雜的過程,可通過其他措施對沖模型精度的差異。

互聯互通方面仍存挑戰

目前,國内隐私計算處于增長期,在政策、技術、産業方面均有很多進展。

隐私計算技術的普及,很大程度解決了金融機構之間資料交流合規問題,但隐私計算技術在安全、性能、互聯互通等方面仍存在不小挑戰。

中關村科金隐私計算方面的專家表示,絕對安全并不存在,但在合理的通信帶寬和算力投入的前提下,基于多方安全計算協定和密碼學算法的隐私計算在B端企業聯合模組化這一場景是安全的。目前,國内由信通院牽頭成立的隐私計算聯盟,以及金融行業的國家金融科技測評中心(銀行卡檢測中心,BCTC)、中國金融認證中心(CFCA)等機構均可對隐私計算産品開展安全測評,對産品的安全性進行評判。目前,中關村科金自研的隐私計算平台正在進行(CFCA)多方安全計算金融應用産品測評,通過在安全性、标準化、合規化等多個層面經過嚴格檢驗,滿足金融場景下資料共享和資料合作的需求,在保護資料安全與隐私前提下,更高效地賦能金融場景,促進資料價值釋放。

性能方面,上述專家表示,由于多方安全計算協定的引入和新型密碼學算法的使用,産生了大量額外的通信、存儲和加解密計算需求,性能目前仍然是限制隐私計算廣泛應用的重要因素。優化加解密算法的效率、降低通信開銷等仍然是目前隐私計算技術研究的熱點。

“互聯互通可能是隐私計算廣泛應用的最大瓶頸。”中關村科金隐私計算專家指出,以聯邦學習而言,國記憶體在着多種技術架構實作的産品,這些産品雖然底層密碼學算法原理一緻,但實質上是無法互聯互通的。已經有股份制銀行聯合金融科技企業,開展互聯互通合作;行業内相關标準化工作正在進展中,相信互聯互通問題會逐漸得到解決。

具體到聯邦學習領域,索信達控股(3680.HK)AI創新中心資料科學家邵俊表示,聯邦學習的應用落地面臨幾大挑戰:一是激勵機制如何設計。聯邦系統由多家機構共同協作完成,要在各方利益都得到滿足的時候才具有可行性。二是隐私保護的問題。即傳輸模型的中間資料若遭洩露,原始資料仍有被推導出來的風險。三是聯邦學習的參與方中,可能存在不誠實參與方的惡意攻擊。

此外,邵俊指出,聯邦學習還有一些其他比如資料傳輸效率的問題。模型訓練會涉及到大量的運算,那麼各方聯合模組化就會涉及到大量的資料進行互動的問題。比如像在梯度下降的時候,每一步的梯度疊代都會涉及到通信成本。是以,通信效率這塊也是聯邦學習在落地過程中會遇到的挑戰。此外,還有像機構與機構之間樣本分布不均衡的問題等等。

“目前,索信達控股正在研究多方安全計算,我們将多方安全計算問題和聯邦學習場景相結合,這在聯邦學習未來也是一個非常有前景的研究方向。”邵俊表示。

繼續閱讀