天天看點

金融業資料應用,在合規與效率之間如何找到出路?

作者:零壹财經
金融業資料應用,在合規與效率之間如何找到出路?

來源 | 零壹财經

作者 | 程遠

2023年1月6日,“第二屆中國信用經濟發展峰會暨零壹智庫年度峰會”線上上舉辦,會議以“建構資料基礎制度,促進信用經濟發展”為主題,圍繞數字經濟、信用經濟等專業話題開展讨論。

在本次峰會“金融業資料生态發展現狀與趨勢”的主題圓桌論壇上,保險行業數字金融和隐私計算專家高翔、全聯并購公會信用委員會專家安光勇、銀雁科技集團助理副總裁李家菁以及零壹研究院院長于百程一起就金融業的資料生态格局、金融業資料應用的堵點、趨勢與機會等話題進行了讨論分析。

金融業資料應用,在合規與效率之間如何找到出路?

主題圓桌論壇由于百程主持。他說,過去一年,國内在資料層面有許多政策和行業的進展,剛釋出“資料二十條”是資料産業發展和應用程序中的關鍵一步。随着數字經濟的發展,資料的積累越來越多,資料産生的價值也越來越大,并成為驅動數字經濟發展的核心生産要素。金融業是數字經濟中數字化程度比較高的領域,在資料驅動下,智能風控、智能營銷、智能營運大大提升了金融業的運作效率。同時,金融業也存在資料合規、資料安全、資料治理、資料共享等問題。

本次峰會由全聯并購公會信用管理專委會、深圳信用促進會、零壹智庫、《陸家嘴》雜志、《價值線》雜志聯合主辦,中央财經大學銀行業研究中心、香港科技大學數字金融實驗室、上海金融與發展實驗室、中國科技體制改革研究會數字經濟研究小組提供學術支援。

金融業資料生态的新格局

關于金融業資料生态的類型,高翔結合信貸和保險公司的日常業務接觸,将資料大緻分為三類。第一類是基礎的資料提供商,比如進行人臉識别和二三四要素的核驗。第二大類是個人或者企業的征信類、資信類資訊資料提供商,比如用于信貸的反欺詐、信用評估、模型建設等方面。這方面的資料包括企業網上經營、個人行為資料、征信類資料等,範圍比較廣。第三類是圍繞着資料提供附加服務的公司,比如圍繞資料提供方法論、征信模型、隐私計算服務,也包括資料交易所等。

高翔說,第一類和第二類資料之是以分開對待,是因為根據《征信業務管理辦法》,凡是涉及到個人和企業信用評估類的資料屬于征信範疇,需要通過征信持牌機構。在具體業務中,通過跟監管機構和征信機構溝通,基于個人身份識别的資料目前并沒有被列為信用評估類的資料進行看待,是以可以不通過征信機構來擷取服務。

安光勇從國内外對比的次元談了對于金融資料生态的看法。他說,國内的金融資料應用還不是一個穩定的狀态。從國外成熟市場來看,金融資料領域比較穩定,資料類型并不像國内這麼豐富多彩,也不需要通過一些替代資料去做補充,相關法律制度也比較完善。相比來講,國内可能過于去關注資料的創新和替代資料,導緻我們忽視了資料的穩定和品質的重要性。實際上,金融行業的客戶資料一般來說是最好的,可支撐信用評估的資料也非常多。而且,做信用評估也不是資料越多越好,資料多了反而可能有很多噪音,成本也比較高。金融資料應用應該是用相對少的資料,得出好的結果。

安光勇說,資料應用要考慮效率和成本的問題,以及替代資料的穩定性問題。在國外,替代資料主要是用在畢業生或者低收入群體,因為他們缺少傳統金融資料。金融領域資料充分、資料敏感,是以金融資料應用和網際網路領域不一樣,重點不應該是放在擴大資料次元和資料創新等方面,而重點應該是更精準、更高效、成本更優上面。

金融是強監管行業,金融資料生态的形成和發展與大陸的征信體系建設密切相關。李家菁說,目前大陸征信體系是政府加市場雙輪驅動的發展模式,央行征信體系的資料庫和市場化征信機構的資料庫協同發展,互為補充。

李家菁說,目前個人征信持牌機構包括百行征信、樸道征信和正在受理中的錢塘征信。企業征信方面包括了130多家在央行分支機構備案的企業征信機構。這些大量的市場化運作的征信公司,依靠自身所處的業态所形成的優勢沉澱了行業資料,可以為金融機構提供多元度的個人行為資料和企業經營資料。不同管道之間的資料,又可以做互相印證和互為補充,這就使得金融機構在金融風控、消費信貸等領域能夠獲得更全面、更精準的使用者畫像資料。從系統建設的角度看,因為在不同資料源之間可以做靈活的、無縫的切換,在一定程度上可以確定銀行業務的連續性和高可用性。

金融資料應用中的堵點與機會

個人信貸和保險營銷等業務,和個人資料息息相關。高翔說,在《個人資訊保護法》出台後,随着三方資料市場的逐漸規範,金融業務層面可運用的資料模型、資料源次元驟減。比如,個保法沒有出台之前,我們的個人信用評估加上反欺詐的模型大概有三四個,外采資料源大概有3000多個次元,這3000多個次元按照一定頻次進行篩選、更換,最終入模入參的可能有幾十個。經過了資料要素市場的更新疊代後,出于合規的考慮,一些資料源停止提供,或者資料源還在但更新不足或者次元減少,進而使得一些機器算法模型效果大減或者不可用,需要通過人工核驗輔助等其他手段來進行調整。

高翔說,經過跟行業的交流跟蹤以及業務實踐,目前摸索出幾個資料應用的方式。第一是跟個人征信持牌機構深度合作,在合理架構下進行資料的深度挖掘,當然有些資料是非标準化的,使用成本比較高。第二是探索嘗試運用隐私計算的方式實作,将不在征信業務管理辦法的要求内的一些合規資料源進行點對點的資料對接,當然此類對接和挖掘也是個性化的。另外,這一方式還要考慮隐私計算的成本、技術的成本、業務了解的成本、投入和應用的成本等。目前我們也上線了自己的隐私計算平台,在合規的前提下邊摸索邊試。第三種方式還處于跟蹤的階段,是跟各地方的資料交易所、地方政府政務資料平台進行溝通對接,對于這種方式未來也寄予厚望。不過總體來看,因為資料源次元不夠,目前模型效果較之前還是差的。

對于近兩年資料領域比較熱的隐私計算賽道,高翔從需求者的角度表示非常看好。他說,金融行業對于資料保護相關的細則檔案非常多,其中很多都已經提到了運用去辨別化手段、匿名化手段來解決資料傳輸過程中的安全問題。目前看隐私計算是最符合去辨別化手段和匿名化手段的一些技術的統稱,這是第一個看好的原因。第二,從本質看,隐私計算是需求方和供應方點對點的資料價值的互動方式。征信持牌機構和資料交易所則是搭造了一個資料中介平台,大家都跟這個中介平台做互動。這兩種方式都是未來資料交易必不可少的方式,平台适合比較标準化的資料産品,而非标準化的資料比較适合隐私計算的點對點方式。第三,隐私計算作為初創行業,已經過了起步階段,行業已經開始優勝劣汰,少數的幾個頭部公司逐漸顯現,進入到集中度彙集的階段。監管部門對于隐私計算持鼓勵态度,一些行業标準也已經出台,是以這個賽道已經非常明晰了。

安光勇從金融創新的方向探讨了資料領域未來的機會。他說,國内金融資料方面的創新主要集中在技術次元,但實際上創新點還有很多,比如法律制度、監管模式以及商業模式創新,這些方向可能是未來的機會。

安光勇說,國外這段時間内把更多的精力放在金融資料法律制度和監管方面的創新,最有代表性的是《通用資料保護條例》(GDPR),比如南韓等國家在GDPR的前提下去發展MyData(本人資料管理)模式,就包括了資料的很多領域,包括可攜帶權,包括隐私計算。是以,未來的發展方向,除了技術次元之外,大家可以更多的在商業模式、法律制度等領域去做一些創新。法律或者制度的落地,對整個社會的影響是很大的,在這方面多花點時間去做研究和創新,可能比花時間在技術次元上的效果更好。

李家菁對于監管層面的創新也非常關注。她表示,金融科技公司跟金融持牌機構聯合去參與央行推出金融監管沙盒,包括跨境金融監管沙盒相關的項目,其實大家都比較關心的就是比如說像針對資料的隐私計算應用入盒之後,未來要達到什麼樣的條件才可以出盒去做大規模的市場推廣和應用。

另外,李家菁從資料應用研發的角度提出未來的趨勢。以往傳統的資料應用往往是采用專家模組化的方式,但專家模組化有一定的缺點,專家的人工成本高,并且比較依賴專家的行業經驗和技術能力。由于這種人為因素的存在,會導緻模組化結果存在不穩定和不确定性,也就是技術風險性。針對這種問題,現在金融行業的應用已經開始逐漸在推廣傳統的模組化方式加上機器學習的方式來解決,這也是未來發展的一個趨勢。

End.

繼續閱讀