天天看點

金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)

作者:魯政委
金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)
金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)
金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)

商業銀行,替代資料,智能風控

資料是數字經濟時代重要的生産要素,更是數字金融的基石,是金融機構數字化轉型與金融科技發展的基礎。雖然規模效應是資料要素價值釋放的重要助力,但是若銀行所擁有和使用的資料品質較差、可用性較低,不僅可能提升銀行的儲存、使用成本,還可能導緻“投毒”模型、造成銀行決策失誤的問題。是以,選擇哪些合适的資料引入和運用成為了未來銀行數字化轉型、做好“數字金融”大文章的重要課題。

實踐中,替代資料(Alternative Data)在金融業務中的重要性已獲得了多方的認可。傳統信貸資料包括信貸額度、曆史記錄等資訊,而替代資料是指金融消費者傳統信貸資料之外的、具備信用補充性質的資料資訊。替代資料的有效運用有助于緩解銀行與企業之間的資訊不對稱,提升授信準确度,防範潛在信用風險,并在一定程度上能助力普惠金融的發展,降低部分市場主體的借貸成本。不過,目前大陸銀行使用替代資料也面臨的一定挑戰:

第一,替代資料來源多樣,與資料來源機構的合作需要設計科學的機制。大陸金融業此前對于替代資料的應用,來源多是政務或公用事業類資料,資料引入的治理也以行政力量為主。未來随着資料來源更加多樣,也将引入更多來自市場機構的資料,需要更科學的市場治理機制。

第二,替代資料标準不一、品質參差不齊,對銀行的資料治理能力提出較高要求。在此背景下,銀行應當做好幾點:一是需要進行資料品質的評價,二是需要進行多資料來源的資料貫标與對齊,三是要逐漸建立在全國範圍内從價值出發的資料篩選工作的能力。

第三,替代資料呈現出體量大、非結構化等特征,商業銀行面臨較高的資料分析能力挑戰。大規模替代資料的引入與應用,商業銀行必須具備相應比對的資料分析能力,尤其是針對非結構化資料,需要儲備相應的方法論。

第四,目前銀行引入替代資料的采購成本較高。短期内資料資産以成本法估值的特點,以及資料交易仍少難以攤薄前期成本的情況,結合“點對點”的撮合交易模式,使得金融機構在從外部擷取資料時容易承受額外溢價。

雖然2021年9月人民銀行釋出的《征信業務管理辦法》規定:“金融機構不得與未取得合法征信業務資質的市場機構開展商業合作擷取征信服務。”不過,在實踐中,一方面,征信資料“斷直連”更聚焦于網絡平台等主體與金融機構的資料直連,公用事業等多種其他類别的資訊并未“斷直聯”。另一方面,目前持牌征信機構數量較少,服務能力受到制約。是以,銀行從授信的角度出發,仍有較大的可能和較強的動力通過多種管道引入替代資料。

目前境内外對于替代資料的分類多是從實際應用角度出發,且存在分類多樣化、缺乏統一性的情況。以世界銀行在2019年釋出的報告《信用評分方法指南》為例,較為成熟的替代資料大緻可以分為四個類别:細分交易資料、移動應用資料、社交網絡資料、公用事業資料。後續我們将從零售客戶和企業客戶兩個角度梳理商業銀行可以使用替代資料的境内外經驗,形成為商業銀行找資料的系列研究報告。

近年來,随着數字經濟發展,經濟活動中産生的資料種類和數量出現了爆炸式增長,資料已逐漸成為數字時代新的生産要素。2023年,中央金融工作會議提出了要做好數字金融大文章的要求,進一步推動了資料要素在金融行業中的應用。在金融機構使用資料的全生命周期中,包括了資料的生成或引入、治理、存儲、加工、應用、傳輸、銷毀等一系列環節。除了銀行經營過程中内部生成的資料之外,資料的引入是銀行運用資料的起點。對于銀行而言,選擇适當的資料進行引入,不僅能提升資料購買、系統建設等投入的成本效益,還可以避免過量引入資料所造成的儲存成本增加、資料架建構設難度增大等問題。為了更好助力銀行找準可以引入的資料,本文将聚焦于銀行資産投放和授信等行為,對銀行可用的替代資料(Alternative data)進行梳理。

一、資料:數字金融發展的基石

資料是數字經濟時代重要的生産要素,更是發展數字金融的基石,有效篩選、用好資料是金融機構數字化轉型與有效發展金融科技的基礎。我們在2023年11月26日釋出的《數字金融:内涵與機遇》[1]報告中指出,資料要素的開發與應用是數字金融的第一層内涵。因而,金融機構對于資料要素的高效開發是金融科技充分發揮作用、金融機構業務模式和管道全面創新的堅實基礎。

從金融機構有效運用資料的角度出發,引入充足、合适和高品質的資料,是銀行使用各類金融科技之“術”賦能提升經營質效之“道”的必然要求。在資料的使用實踐中,規模效應是資料要素價值釋放的重要助力。充足的資料儲備是資料應用的前提,引入豐富多樣的資料将有助于業務前端創新,形成資料總量到業務應用的勢能儲備。不過值得注意的是,銀行所擁有和使用的資料也并非越多越好,如果擁有或使用大量品質較差、可用性有限的資料,不僅會提升銀行儲存、使用資料的成本,還可能因為低質資料誤導結論、“投毒”模型,進而造成銀行微觀乃至宏觀決策出現失誤。

由資料來源入手,将可以最主動地在事前把控好資料品質的“入口”,是以未來選準并引入合适的外部資料将成為銀行發展數字金融的重要根基。從銀行可以運用的資料來看,主要分為兩類:一是銀行在服務客戶或開展交易過程中内部産生的資料;二是銀行無償或有償的從各類外部來源所獲得的資料。在實踐中,不少金融機構對于行内已擁有資料的歸集、梳理和運用已取得初步成效,因而對于資料資源價值的挖掘也逐漸從内部轉向外部。同時,根據我們在2023年12月15日所釋出的《數字金融的大文章如何譜寫?——2024年數字金融展望》[2]報告中指出,未來通過資料流通賦能業務發展将成為資料價值在金融領域釋放的關注點。考慮到各類金融資料敏感性較強、安全等級較高,資料向外流通短期還有一定困難,是以對于銀行等金融機構而言,通過資料流通賦能業務發展的關鍵在于外部資料的引入。

2024年1月,國家資料局等17部門聯合印發《“資料要素×”三年行動計劃(2024—2026年)》(國數政策〔2023〕11号,以下簡稱“《行動計劃》”),旨在解決資料要素應用中存在的資料供給品質不高、流通機制不暢、應用潛力釋放不夠等問題。《行動計劃》給出了工業制造、現代農業、商貿流通等總計12個資料要素聚集的重點領域,梳理了不同領域存在的、可應用的資料資源,并指明了各類資料資源運用的未來發展方向,可以視作大陸各行業領域發展數字經濟的“工作手冊”。

應當指出的是,《行動計劃》不僅在“金融服務”領域重點提出了“支援金融機構融合利用科技、環保、工商、稅務、氣象、消費、醫療、社保、農業農村、水電氣等資料”的要求,還給出了其他經濟領域運轉過程中需重點關注的資料類型。考慮到對于金融機構而言,所有描述企業行為的資料都可以成為金融機構應該關注,并思考是否具有使用價值的資料。是以,《行動計劃》在一定程度上給出了金融機構引入更豐富的外部資料的方向指引。例如,在綠色低碳領域,《行動計劃》提出要“支援打通關鍵産品全生産周期的物料、輔料、能源等碳排放資料以及行業碳足迹資料”,雖然該要求并沒有明确提到金融服務,但在碳交易過程中,金融服務不可或缺。我們此前在2023年9月17日釋出的報告《數字人民币與碳賬戶融合發展意義重大》[3]中指出,數字貨币與碳賬戶的緊密結合,将準确、高效、便捷地記錄碳足迹,有助于推動智能合約在綠色金融業務領域的應用。又如,在交通運輸領域中,《行動計劃》提出要“建構覆寫車輛營運作為、事故統計等高品質動态資料集,為差異化信貸、保險服務、二手車消費等提供資料支撐”,由此而産生的資料更将可以直接應用于金融服務中。

金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)

二、替代資料:銀行可用資料的潛在“富礦”

2.1 替代資料的使用重塑金融業

替代資料(Alternative Data)在金融業的重要性已獲認可。美聯儲在2005年發表的工作論文《A Century of Consumer Credit Reporting in America》中給出了替代資料的定義,替代資料是指金融消費者傳統信貸資料之外的、具備信用補充性質的資料資訊(Hunt,2005)。根據上述定義,傳統信貸資料包括信貸額度、曆史交易資料等資訊。是以,前述《行動方案》中提到的資料均屬于替代資料範疇。

在大陸,金融機構對于替代資料的應用也獲得了監管部門的認可和鼓勵。2021年9月27日,人民銀行釋出《征信業務管理辦法》(人民銀行令〔2021〕第4号),将信用資訊“按照依法采集、為金融等活動提供服務、用于識别判斷企業和個人信用狀況等三個次元,将符合上述标準的基本資訊、借貸資訊、其他相關資訊,以及基于這些資訊的分析評價資訊界定為信用資訊”,其中的“其他相關資訊”基本與此前美聯儲所述的“替代資料”定義相同。在人民銀行為《征信業務管理辦法》配發的答記者問中,人民銀行還進一步指出[4],“随着數字經濟的快速發展,網際網路和大資料等新技術在征信領域廣泛應用,大量有效‘替代資料’被采集、分析和應用于判斷企業和個人信用狀況,征信已突破傳統借貸資訊共享的範圍”。是以,《征信業務管理辦法》“将征信‘替代資料’應用納入監管,并強調從事征信業務需取得合法資質”。

替代資料的有效運用有助于緩解銀行與企業之間的資訊不對稱,進而提升信貸市場效率,并在一定程度上降低部分市場主體的借貸成本。IMF在2019年發表的《資料的經濟效應與含義:全覽視角》(The Economics and Implications of Data: An Integrated Perspective)報告中指出[5],資料可能會對銀行和金融科技企業在貸款領域的市場結構産生影響,若有銀行能将财務資料與來自網際網路的各類替代資料相結合,将使得金融機構在競争中獲得比較優勢:

第一,有助于提高銀行的授信能力。北京大學國家發展研究院副院長黃益平在研究中指出,依靠大資料的風控模型具有突出的資訊優勢和模型優勢,能夠更加準确地預測違約,進而有效提升銀行的信貸投放能力(黃益平和邱晗,2021)。

第二,促進金融服務的可得性,并降低普惠小微主體的借貸成本,助力普惠金融。此前,全球各主要經濟體金融機構在面向小微企業等各類主體開展普惠金融信貸投放的過程中,一大痛點就在于銀企之間的資訊不對稱。為了緩解資訊不對稱所造成的潛在信用風險高企,銀行一般通過提升貸款利率,以更高的利息水準來覆寫可能的信用風險損失。清華大學研究團隊的一篇研究論文指出,資料要素的互動将可以影響信貸市場的競争格局,若商業銀行與金融科技企業共享客戶的财務資料和網際網路資料,将有助于提高信用分析精度并促進市場競争,不僅會增加高信用品質借款者獲得貸款的機率,還會降低貸款利率(謝丹夏等,2022)。

2.2 商業銀行替代資料應用存挑戰

應當指出的是,雖然替代資料的應用對銀行授信有着較好的提升效果,但同樣存在一定的挑戰。

第一,替代資料來源多樣,與資料來源機構的合作需要設計科學的機制。人民銀行征信研究中心2023年的研究成果指出,基于替代資料共享中的頻率、資料專用性、影響資料共享的不确定性等,需要針對不同替代資料來源,選擇合适的引入機制。目前較為成熟的替代資料治理機制有市場治理機制、層級治理機制與混合治理機制。市場治理是指在契約治理過程中,主要借助市場機制下的高激勵強度實作替代資料流動契約的執行。層級治理是指在契約治理過程中,主要借助行政控制的力量推動契約的達成和執行。混合治理是指在契約治理過程中,既依靠市場治理的激勵強度,也依靠層級治理的行政力量,進而在各方面處于中間狀态。例如,當資料專用性越強、預期未來會與同一夥伴頻繁交易、該夥伴是否合作的不确定性越高時,采用以行政力量為主的層級治理就更能節約交易成本(賀新宇,2023)。

金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)

應當指出的是,大陸金融業前期替代資料的應用,由于來源大多是稅務、公積金的政府公共資料,資料引入的治理機制也以行政力量為主導的層級治理為主。未來,随着資料來源更加多樣,替代資料來源中也将出現更多的市場機構,需要更加科學的市場治理機制。各地大資料交易所一方面通過資料交易的收益提供了市場激勵,另一方面也将具備一定的行政影響,或将成為混合治理機制的關鍵。

第二,替代資料标準不一、品質參差不齊,對銀行的資料治理能力提出較高要求。不同來源的資料标準不統一,資料品質良莠不齊,資訊黑箱嚴重,嚴重阻礙資料要素市場流動,是商業銀行引入外部資料時面臨的普遍情形。真實性原則、完整性原則、及時性原則、安全性原則是利用替代資料開展征信業務的主要原則(賀新宇,2023)。未來,商業銀行的資料治理能力需在以下方面重點提升:

一是需要進行資料品質的評價工作。資料品質是影響資料使用的最重要因素,需要建立資料品質評價的普适方法論。與資料價值評估不同,資料品質評價不需将資料品質與貨值進行對應,可以采用估值技術法對資料進行品質評價,應重點關注資料包含的資訊量、完整性、有效性、及時性等。值得注意的是,資料造假同樣屬于資料品質問題,由于該問題容易在後續分析中造成嚴重的資料問題,需要設定前置模型對資料真實性進行檢測。

二是需要進行多資料來源的資料貫标與對齊工作。由于目前資料要素市場相對分散,尚無法形成覆寫全國範圍的資料産品,而在全國統一大市場的趨勢下,跨地域企業不斷增多,銀行面臨着跨區域授信場景,對覆寫全國範圍内的統一資料有着強烈需求。然而由于資料在不同地區、不同行業、不同企業之間的标準不統一,建立統一的企業級資料字典并對引入的外部資料同步貫标是形成資料規模優勢的難點所在。企業級資料字典覆寫銀行各業務和技術活動中涉及的所有資料資訊,通過對資料資訊的表達、格式及定義的一緻約定,實作對資料标準化、結構化的描述,為業務、技術人員提供明确的資料規範,促進資料統一。

三是要具備在全國範圍内從價值出發的資料篩選工作。目前大陸資料交易市場仍相對分散,資料産品品類複雜,品質參差不齊,即使經過資料交易所的初步稽核,資料品質較雙邊交易有所提升,但仍無法保證資料能完全滿足業務需求,或確定該資料可以帶來足額的附加價值。是以,我們在2023年12月15日釋出的報告《數字金融大文章如何譜寫?——2024年數字金融展望》[6]中指出,未來全國性商業銀行應考慮在總行層面建立資料篩選準入機制,統籌各業務條線、各分行的資料需求,在全國的資料交易所内進行資料篩選,綜合考量資料來源、資料品質以及資料可能帶來的價值,引入最合适的資料産品。

第三,替代資料呈現出體量大、非結構化等特征,商業銀行面臨較高的資料分析能力挑戰。随着技術水準的進步,資料的内涵不斷延申。

一方面,是資料的産生從主動記錄到被動産生并記錄。在銀行存取款仍采用存折方式的時代,銀行掌握的資料僅為客戶的存取款記錄,而這是需要客戶到銀行網點辦理業務主動記錄的。随着金融電子化的推進,目前銀行的客戶可以通過移動網絡使用銀行服務,使用過程中被動地産生大量資料并被記錄下來,除賬戶資訊外,還有使用者對于銀行APP的使用頻率、使用習慣、風險好惡等,在擷取使用者許可後相關資訊和資料不斷的生成和記錄,這不僅拓展了資料的次元,還極大的增大了資料的體量。

另一方面,是資料類型從結構化到非結構化。在數十年之前,資料經常和表格聯系在一起,大多數的資料為字段的觀測,具有明顯的行列結構;而随着技術的進步,三維矩陣像素結構的圖檔、數列音軌結構的音頻、連續三維矩陣結構的視訊、序列結構的語言文字等,均是非結構化的資料,這些資料在人臉識别、語音控制、翻譯等日常領域中已經深度應用。大規模替代資料的引入與應用,使得商業銀行也必須具備相應比對的資料分析能力,尤其是針對非結構化資料,需要儲備相應的方法論。

第四,目前銀行引入替代資料的采購成本較高,短期内資料資産以成本法估值且尚未形成規模化交易的情況,以及“點對點”的撮合交易模式或将使金融機構承受額外資料采購溢價。

從理論上來看,在早期的資料要素市場中,資料資産估值将以成本法為主,若是資料資産交易尚未規模化開展,則資料形成前期的固定成本将難以攤薄,進而會擡高資料資産估值。成本法操作簡單,适合作為資料要素市場發展初期的估值方法,在推動企業資料資産入表上具有速度快、争議少的特點,也是目前主流的資料資産估值方法。但由于資料資産的成本主要集中在前期的固定成本上,若是無法形成大規模資料交易,那麼可能出現金融機構等資料需求方在早期購買資料資産時承受額外“溢價”的情況。據調研了解,某地公用資料資産将前期的平台建設成本計入資料資産成本,最終由引入該資料資産的十數家金融機構平攤該項成本。應當指出的是,後續随着資料資産的大範圍運用于交易,形成資料資産所需的前期固定成本被攤薄,機關資料資産的成本将有所回落,銀行引入替代資料的成本将有所降低。

從實踐中來看,目前各大資料交易平台仍然主要采取“點對點”的撮合模式,資料交易成本仍較高。以貴陽大資料交易所為例,其針對不同産品支援多元化的交易收費方式。一是針對資料查詢、資料服務等交易标的,采取按次收費的方式,如貨車風險評分的收費方式為每次8元,DSMM評估服務的價格為每次20萬元。二是針對離線資料集等交易标的采取一次付費終身使用的方式,以金融場景中的資料資産包為例,其中包括農民工工資的數額、發放人數以及工資發放時間等,由貴州明翌達科技服務股份有限公司提供,标的價格為1萬元。不過,一次付費終身使用的方式并未給出後續資料更新的具體條款。三是針對特殊資料産品或定制化服務,需采取面議價格的收費方式,如貴州省的氣象線上資料産品服務、知識圖譜建構與挖掘工具等。應當指出的是,未來,随着資料要素市場的成熟,資料資産流通的愈發健全和完備,資料流通過程中的交易方式也将不斷豐富,更高的流動性和更豐富的交易手段也将可能逐漸壓降資料資産的标價,進而降低銀行從外部擷取資料的成本。

2.3 征信斷直連對替代資料應用的影響

2021年9月,人民銀行依據《個人資訊保護法》等上位法釋出《征信業務管理辦法》(中國人民銀行令[2021]第4号,以下簡稱“《征信辦法》”),規定“金融機構不得與未取得合法征信業務資質的市場機構開展商業合作擷取征信服務”。具體來說,即網絡平台在與金融機構開展助貸等業務時,不能直接将網絡平台獲得和存儲的個人資訊以及平台其他資料直接向金融機構提供。而需統一經過持牌征信機構的轉接,“網絡平台—征信機構—金融機構”成為替代資料應用于金融業的新模式。

《征信辦法》于2022年1月1日起施行,考慮到信用資料“斷直連”将給網際網路平台、資料公司等與金融機構的業務合作模式帶來較大的調整壓力,因而《征信辦法》設定了過渡期,允許暫未取得征信業務資質但實質從事征信業務的市場機構在2023年6月底前完成整改。不過,在實際落地過程中,資料“斷直聯”仍存在一些細節有待厘清:

一是斷直連的資料範圍并不明晰。《征信辦法》第三條規定:“信用資訊是指為金融經濟活動提供服務,用于判斷個人和企業信用狀況的基本資訊、借貸資訊、其他相關資訊,以及基于前述資訊形成的分析、評價類資訊。”同時,《征信辦法》規定:“征信業務是指對企業和個人的信用資訊進行采集、整理、儲存、加工,并向資訊使用者提供的活動。”

從理論上來看,設定較為寬泛的信用資訊定義,從廣義上可以涵蓋所有用于征信的資訊,進而使得使用信用資訊開展征信業務需要全部斷直連。但在實踐中,《征信辦法》對資料“斷直連”重點針對的是大型網絡平台利用其資料與金融機構合作授信的業務模式,而大型網絡平台資料僅是替代資料的一個類别,商業銀行在引入社保、稅務、公積金等替代資料用于授信時未受到影響。是以,征信資料“斷直連”并非斷掉所有替代資料,鑒于銀行等金融機構仍然保有自主獨立授信的需求,其引入替代資料仍然具有較高業務價值。

二是持牌征信機構數量較少,服務能力受到制約。目前,持有人民銀行發放的個人征信牌照的機構僅有百行征信與樸道征信,上述兩家機構先後于2018年與2020年獲得人民銀行個人征信業務許可。其中,百行征信的大股東為中國網際網路金融協會,持股36%,另有考拉征信、騰訊征信等8家企業分别持股8%;樸道征信的大股東為北京金融控股集團,持股35%,京東科技、北京小米等4家企業共同持股65%。在上述兩家機構獲得拍照後,個人征信牌照審批陷入暫停。早在2021年11月,錢塘征信個人征信牌照業務申請已獲人民銀行受理,但審批結果卻暫未公開。錢塘征信股東中,浙旅投集團、螞蟻集團分别持股35%,同為大股東,錢塘征信個人征信牌照暫緩或是受到螞蟻集團整改的影響。2024年1月24日,人民銀行行長潘功勝在國新辦新聞釋出會上表示人民銀行正會同浙江省政府指導錢塘征信申請辦理個人征信牌照[7],或意味着個人征信牌照的申請稽核工作再度開啟。

金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)

短期來看,持牌個人征信機構的數量不會大幅增加,而且其同時面臨巨大的人員、裝置、技術、資料分析和治理能力等方面的壓力,海量、高頻、關聯度低且場景性極強的替代資料,與傳統信貸記錄差異巨大,且更新疊代的速度極快,若僅靠兩家持牌征信公司,很難據此形成完整的客戶“畫像”(張健華和朱詩怡,2023)。

是以,從商業銀行自身征信的需求側與持牌個人征信機構的供給側來看,商業銀行均有引入替代資料進行自主獨立授信的需求。

三、金融行業替代資料應用綜述

3.1 替代資料範圍與分類

目前境内外對于替代資料的分類多是從實際應用角度出發,且存在多樣化、缺乏統一性的情況,由于替代資料的實際探索運用走在了理論研究之前,是以現有的多種基于實踐的替代資料範圍界定和分類方式仍存在較多缺陷,有較大改進空間。

替代資料已将聚焦局限于銀行可用于授信支援的範疇之内,然而,替代資料的定義方式決定了其範圍仍然是廣泛乃至無限的。由于經濟的發展模式正在逐漸走向電子化和數字化,可記錄的資訊逐漸增多,可應用的替代資料也日漸豐富,現有分類方式較難涵蓋所有替代資料。

人民銀行費憲進等(2020)的研究指出,由于各國經濟金融環境存在差異,同類資訊的采集難易度、用于信貸決策的價值不一,是以替代資料的采集範圍和内容存在差異。費憲進等(2020)将替代資料分為八個類别:一是需要定期付款的付款資料,如電信、租金、保險或公用事業繳費;二是賬戶交易和現金流量資料等客戶資産資訊,如存款、收入資訊等;三是客戶穩定性資料,如職業、住址等更換頻率;四是客戶基礎資訊,如教育程度、工作崗位等;五是消費者資質資訊,如證書、獎勵、行政許可等;六是客戶網絡行為資訊,如網絡評論、社交平台資訊等;七是客戶社交節點資訊。

金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)

清華大學五道口金融學院的研究則進一步将替代資料的分類進行整合[8],将目前應用較為廣泛的替代資料分為以下四大類:一是公用事業資料,包括水、電、氣、通信等繳費資訊。二是政府和司法部門資料,包括納稅、法院判決、學曆、就業等資訊。三是場景資料,包括社交資訊、電子商務資訊、支付結算流水等資訊。四是調查性資料,指有關消費者品性、一般名譽、個人消費者特點或生活方式的資訊。

世界銀行在2019年釋出報告《信用評分方法指南》[9](Credit Scoring Approaches Guidelines),指出應用較為成熟的替代資料可以分為四個類别:一是細分交易資料(Granular Transactional Data),例如信用卡交易資料、企業轉賬資料等,交易資料可以提供更加豐富與及時性更強的客戶财務狀況(Barasch,2017)。二是移動應用資料(Mobile Data),智能手機使用量的大幅增加導緻了各種各樣的結構化和非結構化資料的出現,例如APP使用資料、地理位置資料等,可以極大改善傳統授信方式的有效性(Grab,2018)。三是社交網絡資料(Social Media Data),Blazquez and Domenech(2018)的研究指出,客戶在社交網絡的動态有助于更好地了解其生活方式、償債意願與能力。四是公用事業資料(Utilities Data),主要是是指稅務、水電等公用事業賬單支付曆史記錄。

從上述各項研究的分類可以看出,替代資料的分類原則大體相似,主要是從實際應用出發,沒有嚴格标準。不過替代資料分類原則的相對多樣化和缺乏統一标準也導緻了替代資料的分類存在一定的局限性:一方面,導緻分類之間存在互相交叉的情況,例如客戶基礎資訊與客戶資質資訊較為同質化,社交網絡資料與移動應用資料存在交叉。另一方面,覆寫範圍不全面,消費、醫療、車聯網等替代資料并未覆寫。

未來,随着替代資料的深度應用,由于替代資料的開放性,即幾乎所有資料在進行零售與企業客戶畫像時均可有助益,替代資料的類别将更加豐富。

3.2 替代資料應用監管要點

替代資料的應用是以商業銀行為代表的金融機構發展的重大機遇,一方面将可以提高商業銀行的授信能力,在土地金融逐漸失效的大背景下,增強商業銀行的信用貸投放能力;另一方面有助于推進普惠金融,可以擴大商業銀行服務的客戶群體範圍。但替代資料的應用涉及個人隐私、資料安全、網絡安全等諸多方面。2023年11月末召開的中央金融工作會議提出“數字金融”作為五篇大文章之一,資料要素作為數字金融的基石,針對替代資料在金融領域的應用需要全面科學的監管設定。

世界銀行在2017年釋出研究報告《替代資料改善中小企業融資》[10](Alternative Data Transforming SME Finance),其指出了未來針對替代資料應用的部分監管政策要點:

一是資料隐私保護。随着從客戶的消費記錄、移動足迹到社交媒體等收集到的替代資料範圍和類型不斷增加,人們對隐私和對資料收集和使用方式透明性的需求也愈發關注。伴随銀行對零售客戶畫像的不斷深入,必然會出現所收集資料向個人隐私資料的無限逼近。在強調個人隐私與資料安全的大背景下,合法合規是銀行使用資料的紅線。不同司法轄區的資訊隐私法律、規則和原則也存在廣泛差異。以資料隐私保護最為嚴格的歐盟為例,自《通用資料保護條例》(General Data Protection Regulation,GDPR)于2018年正式施行以來,歐盟、歐盟成員國的資料監管機構以GDPR為依據向美國大型跨國企業施以處罰的案例達到數百起。2022年,違規的罰款額達到創紀錄的29億歐元[11],處罰的主要原因包括資料壟斷、侵犯個人隐私與資料洩露等。大陸也在《個人資訊保護法》中規定了個人資訊與敏感個人資訊的分類規則,以及“最小、必要、征求同意”的個人資訊處理原則。

二是針對征信服務商(Reporting Service Providers)的監管。征信服務商包括征信機構、資料代理商、資料經濟商、資料分析服務商等機構,由于征信服務商涵蓋資料的收集、存儲、分析與流轉的全過程,其間涉及資料的權屬、責任與權益的劃分。資料這一新型生産要素的特殊性造成了征信服務商業模式的特殊性,結合資料安全與個人隐私保護,收集和共享替代資料的監管政策制定是監管當局需要面臨的最大挑戰。世界各國的征信模式均不相同,大陸以人民銀行征信系統為主包括個人征信與企業征信,輔以私營征信機構,即前述《征信辦法》中的持牌個人征信機構百行征信、樸道征信與企業征信機構。美國則以私營征信機構為主,其中企業征信又分為資本市場信用和普通企業信用,資本市場信用機構有标普、穆迪、惠譽等,普通企業信用機構包括鄧白氏等;美國個人征信體系機構以Experian、 Trans Union和Equifax三大征信機構為主體[12]。應當指出的有兩點,一是針對征信服務商的政策制定需要在市場活力、監管合規與隐私保護中做出權衡;二是商業銀行在引入替代資料的過程中仍需頻繁直接接觸資料經紀商、資料服務商等機構。

三是信貸産品的定價透明性。基于替代資料進行授信,可以在技術手段上實作信貸産品利率的“千人千面”,即按照客戶的個體情況,針對性的确定貸款利率,以無限可選的利率去對應無限的客戶需求。但是,千人千面的利率定價會造成公平問題,即算法黑箱普遍存在的“價格歧視”,在實際執行中面臨挑戰。世界銀行認為,金融機構基于替代資料與模型進行授信時,要保證信貸産品的定價透明性,進而保證金融公平。算法的透明性與可解釋性是金融監管部門的監管重點,人民銀行在2021年3月釋出了《人工智能算法金融應用評價規範》(以下簡稱“《規範》”)作為推薦性行業标準,提出在安全性評價、可解釋性評價、精準性評價、性能評價四個方面對金融算法的評價标準。《規範》的安全性評價中規定算法所用目标函數設計上不存在膚色、性别、國籍、健康等偏見歧視。

目前來看,金融機構對替代資料的應用處于初級階段,對于公用事業資料等易得性較高的替代資料應用較為成熟。在境内,稅務、公積金、社保等公用資料已普遍被商業銀行納入考慮;在國際上,Experian等個人征信機構也已将水電費的支付行為應用于貸款違約的預測,以幫助銀行進行貸前授信[13]。在其他替代資料的探索應用上,金融機構呈現點狀創新為主的特點。例如,國内金融機構利用遙感氣象資料實作物聯網與金融業務的深度結合,利用遙感資料進行查勘定損和理賠,特别是農業方面的保險理賠等。北美人壽保險公司John Hancock自2018年起将逐漸停止承保傳統人壽保險,轉而隻銷售通過可穿戴裝置和智能手機追蹤健身和健康資料的互動式保險[14]。

對于商業銀行來說,服務的客戶大緻可以分為零售客戶、企業客戶與同業客戶,考慮到相較于其他兩類客戶,資料運用賦能銀行對同業客戶授信能力提升的邊際作用相對較弱。是以,後續我們将從零售客戶和企業客戶兩個角度梳理商業銀行可以使用替代資料的境内外經驗,形成為商業銀行找資料的系列研究報告,其中既包括應用較為成熟的替代資料,也包括此前應用較少的新型替代資料。

參考文獻:

(1)費憲進,汪雨,朱秋琪,等.征信視角下的替代資料應用研究[J].征信,2020,38(05):8-12+51.

(2)賀新宇.交易成本經濟學視角下的替代資料共享機制[J].征信,2023,41(01):26-33.

(3)黃益平,邱晗.大科技信貸:一個新的信用風險管理架構[J].管理世界,2021,37(02):12-21+50+2+16.DOI:10.19744/j.cnki.11-1235/f.2021.0016.

(4)清華五道口金融發展與監管科技研究中心,“征信新規”下的信用資料分享問題研究,2022年第15期總第119期,2022年12月10日。

(5)尚龍飛,王華傑,徐露.基于條件代理重加密的區塊鍊醫療資料共享模型[J].現代電子技術,2024,47(01):78-83.DOI:10.16652/j.issn.1004-373x.2024.01.014.

(6)謝丹夏,魏文石,李堯等.資料要素配置、信貸市場競争與福利分析[J].中國工業經濟,2022(08):25-43.DOI:10.19581/j.cnki.ciejournal.2022.08.006.

(7)張健華,朱詩怡.替代資料在征信業中的應用與國際經驗[J].征信,2023,41(12):13-19.。

(8)Altman, E. I., & Sabato, G. (2007). Modelling credit risk for SMEs: Evidence from the US market. Abacus, 43(3), 332–357.

(9)Askar, M. , Aboutabl, A. and Galal, A. (2022) Utilizing Social Media Data Analytics to Enhance Banking Services. Intelligent Information Management, 14, 1-14. doi: 10.4236/iim.2022.141001.

(10)Berg, T., M. Puri, and J. Rocholl (2017): Loan Officer Incentives, Internal Rating Models and Default rates, Working Paper.

(11)Barasch, Ron. 2017. “Leveraging Alternative Data to Energize Your Lending Portfolio.” Yodlee.com. https://www.yodlee.com/blog/leveragingalternative-data-energize-lending-portfolio/.

(12)Blazquez, Desamparados, and Josep Domenech.2018. “Big Data Sources and Methods for Social and Economic Analyses.” Technological Forecasting and Social Change 130: 99–113.

(13)Ciampi, F. (2015). Corporate governance characteristics and default prediction modeling for small enterprises. An empirical analysis of Italian firms. Journal of Business Research, 68(5), 1012–1025.

(14)F. M. Manzira and F. Bankole, "Application of Social Media Analytics in the Banking Sector to Drive Growth and Sustainability: A Proposed Integrated Framework," 2018 Open Innovations Conference (OI), Johannesburg, South Africa, 2018, pp. 223-233, doi: 10.1109/OI.2018.8535833.

(15)Grab. 2018. “Grab and Credit Saison Form Financial Services Joint Venture to Expand Access to Credit for Southeast Asia’s Unbanked.” March. https://www.grab.com/sg/press/others/grab-and-credit-saisonform-financial-services-joint-venture-to-expandaccess-to-credit-for-southeast-asias-unbanked/.

(16)Grunert, J., Norden, L., & Weber, M. (2005). The role of non-financial factors in internal credit ratings. Journal of Banking and Finance, 29(2), 509–531.

(17)Hunt R. M. A Century of Consumer Credit Reporting in America[R]. Federal Reserve Bank of Philadelphia working paper NO.05-13,2005.

(18)Norden, L., & Weber, M. (2010). Credit line utilization, checking account activity, and default risk of bank borrowers. Review of Financial Studies, 23(10), 3665–3699.

(19)Tobias Berg, Valentin Burg, Ana Gombović, Manju Puri, On the Rise of FinTechs: Credit Scoring Using Digital Footprints, The Review of Financial Studies, Volume 33, Issue 7, July 2020, Pages 2845–2897, https://doi.org/10.1093/rfs/hhz099.

(20)Zhang, M., & Pang, L. J. (2019). Review of domestic application research of big datamining technology-SVM in credit risk evaluation. In 3rd international seminar on education innovation and economic management (SEIEM 2018). Atlantis Press.

注:

[1]https://open.weixin.qq.com/connect/oauth2/authorize?appid=wxf7eeddbe7ba26a5c&redirect_uri=https%3A%2F%2Fapp.cibresearch.com%2Ftiptap_web%2Findex.html%23%2FshareUrl%3Fid%3D19aa4299ef9b2dbfd92cd1e7807a4073%26from%3Dapp&response_type=code&scope=snsapi_base&state=123#wechat_redirect。

[2]https://app.cibresearch.com/tiptap_web/index.html#/shareUrl?id=35a3e8396b7f34fae7a6ed0a5aff2ede&from=app。

[3]https://open.weixin.qq.com/connect/oauth2/authorize?appid=wxf7eeddbe7ba26a5c&redirect_uri=https%3A%2F%2Fapp.cibresearch.com%2FshareUrl%3Fname%3D402388a08a4f8a31018aa233ae7e0016&response_type=code&scope=snsapi_base&state=STATE#wechat_redirect。

[4]資料來源:中央人民政府官網,中國人民銀行有關負責人就《征信業務管理辦法》答記者問,EB/OL,2021/10/1[2024/2/8],https://www.gov.cn/zhengce/2021-10/01/content_5640686.htm。

[5]資料來源:IMF官網,The Economics and Implications of Data: An Integrated Perspective,EB/OL,2019/9/23[2024/2/8],https://www.imf.org/en/Publications/Departmental-Papers-Policy-Papers/Issues/2019/09/20/The-Economics-and-Implications-of-Data-An-Integrated-Perspective-48596。

[6]https://app.cibresearch.com/tiptap_web/index.html#/shareUrl?id=35a3e8396b7f34fae7a6ed0a5aff2ede&from=app。

[7]資料來源:新華社,中國人民銀行行長潘功勝:将設立信貸市場司 做好“五篇大文章”相關工作,EB/OL,2024/1/24[2024/2/8],https://baijiahao.baidu.com/s?id=1788961374382734359&wfr=spider&for=pc。

[8]資料來源:清華五道口金融發展與監管科技研究中心,“征信新規”下的信用資料分享問題研究,EB/OL,2022/11/28[2024/4/8],http://thuifr.pbcsf.tsinghua.edu.cn/PBCSF202215.pdf。

[9]資料來源:世界銀行官網,Credit Scoring Approaches Guidelines,EB/OL,2019[2024/4/8],https://thedocs.worldbank.org/en/doc/935891585869698451-0130022020/original/CREDITSCORINGAPPROACHESGUIDELINESFINALWEB.pdf。

[10]資料來源:世界銀行官網,Alternative Data Transforming SME Finance,EB/OL,2017/5[2024/4/8],https://documents1.worldbank.org/curated/en/701331497329509915/pdf/116186-WP-AlternativeFinanceReportlowres-PUBLIC.pdf。

[11]資料來源:中國商務部官網,2022年歐盟資料違規罰款總額翻倍至29億歐元,EB/OL,2023/2/15[2024/4/7], http://ie.mofcom.gov.cn/article/jmxw/202302/20230203385050.shtml。

[12]資料來源:前瞻經濟學人,2022年全球征信行業發展模式對比剖析 中國以公營模式為主,EB/OL,2022/3/24[2024/4/7],https://baijiahao.baidu.com/s?id=1728164776294914791&wfr=spider&for=pc。

[13]資料來源:Experian官網,Experian Boost: How to sign up, how soon it ‘boosts’ score,EB/OL,2022/4/13[2024/4/7],https://www.creditcards.com/education/experian-boost-how-it-works/#:~:text=Launched%20in%202019%2C%20Experian%20Boost%20is%20a%20program,a%20win-win%20for%20consumers%20and%20the%20credit%20bureau。

[14]資料來源:Insurance Journal,John Hancock Will Only Sell Interactive Life Insurance with Fitness Data Tracking,EB/OL,2018/9/19[2024/4/8],https://www.insurancejournal.com/news/national/2018/09/19/501747.htm#:~:text=John%20Hancock%2C%20one%20of%20the%20oldest%20and%20largest,devices%20and%20smartphones%2C%20the%20company%20said%20on%20Wednesday。

金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)
金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)
金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)
金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)
金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)
金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)
金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)
金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)
金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)

免 責 聲 明

興業經濟研究咨詢股份有限公司(CIB Research Co.,Ltd.)(中文簡稱“興業研究公司”)提供,本報告中所提供的資訊,均根據國際和行業通行準則,并以合法管道獲得,但不保證報告所述資訊的準确性及完整性,報告閱讀者也不應自認該資訊是準确和完整的而加以依賴。

本報告中所提供的資訊均反映本報告初次公開釋出時的判斷,我司有權随時補充、更正和修訂有關資訊,但不保證及時釋出。本報告内容僅供報告閱讀者參考,一切商業決策均将由報告閱讀者綜合各方資訊後自行作出,對于本報告所提供的資訊導緻的任何直接或間接的後果,我司不承擔任何責任。

本報告的相關研判是基于研究員本人的知識和傾向所做出的,應視為研究員的個人觀點,并不代表所在機構。我司可根據客觀情況或不同資料來源或分析而發出其它與本報告所提供資訊不一緻或表達不同觀點的報告。研究員本人自認為秉承了客觀中立立場,但對報告中的相關資訊表達與我司業務利益存在直接或間接關聯不做任何保證,相關風險務請報告閱讀者獨立做出評估,我司和研究員本人不承擔由此可能引起的任何法律責任。

本報告中的資訊及表達的觀點并不構成任何要約或投資建議,不能作為任何投資研究決策的依據,我司未采取行動以確定此報告中所指的資訊适合個别的投資者或任何的個體,我司也不推薦基于本報告采取任何行動。

報告中的任何表述,均應從嚴格經濟學意義上了解,并不含有任何道德、政治偏見或其他偏見,報告閱讀者也不應該從這些角度加以解讀,我司和研究員本人對任何基于這些偏見角度了解所可能引起的後果不承擔任何責任,并保留采取行動保護自身權益的一切權利。

本報告版權僅為我司所有,未經書面許可任何機構和個人不得以任何形式翻版、複制和發表。除非是已被公開出版刊物正式刊登,否則,均應被視為非公開的研讨性分析行為。如引用、刊發,需注明出處為“興業經濟研究咨詢股份有限公司”,且不得對本報告進行有悖原意的引用、删節和修改。

我司對于本免責聲明條款具有修改和最終解釋權。

金融行業 | 商業銀行替代資料應用綜述——為銀行找資料系列(一)

繼續閱讀