天天看點

大資料征信需把控 資料源的“量”與“度”

随着網際網路的發展,大資料征信已被越來越多地運用到金融領域,網際網路金融平台利用大資料判斷使用者的信用記錄是否良好,進而授予使用者相應的信貸額度。傳統銀行也在加緊布局大資料網絡,試圖與網際網路平台接軌。與傳統信用評估模型不同的是,傳統的信用評估是根據一個人的借貸曆史和還款表現,通過邏輯回歸的方式來判斷這個人的信用情況,而大資料征信的資料源則十分廣泛,電子商務、社交網絡和搜尋行為等都産生了大量的資料,在如此海量的資料面前,如何把控資料源的“量”與“度”是網際網路平台和傳統金融機構需要重視并解決的問題。

如今一切資訊皆可以成為信用資料,經過分析後用于證明一個人或企業的信用狀況。大資料的“量”是指有多少個體在被分析,每一個網上新增賬號的個體都可以成為被分析的對象。資料源的“度”是指被分析的個體都有哪些方面能夠成為可以參考的資料。有很多人認為資料能夠被稱為“大資料”需具備兩個因素:第一要覆寫面廣,使用者足夠多;第二次元廣,要從一個人行為的方方面面反映個體的行為與信用的關系。但是,筆者認為事實并非如此,資料的“量”與“度”也應嚴格加以控制。

把控大資料的“量”關鍵在于從大量的資料之中篩選出“有效使用者”。無論是在傳統金融領域,還是網際網路金融領域,給客戶做信用評估的前提是必須知道這個人就是他自己。是以,如何證明“你是你”是大資料征信首先要解決的問題。然而現實的情況是:一個人可以同時申請多個賬号,多個人在知道賬戶資訊的條件下也可以同時使用一個賬号。在這樣的情況下資料資訊往往有所重疊。是以,資料的體量大并不代表資料更加可靠。

随着越來越多的金融業務網際網路化,“反欺詐”面臨的挑戰也日益增大。“身份認證”的重要性在各項監管檔案中反複被強調,而各家機構也在不斷探索如何利用新的技術在網上實作身份的核實。金融機構在重視資料量的同時還可運用先進的科學技術手段,如指紋、虹膜、人臉識别等一系列生物識别技術,将大量的無效資訊排除在外,同時也能夠抵禦資料造假所帶來的信用風險。

對資料源“度”的有效性進行控制也是金融平台和金融機構需要考慮的問題。社交軟體在資料量上有着非常明顯的優勢,許多社交軟體常常從使用者行為上分析判斷一個人的信用是否良好,這就有可能出現“分析過度”的情況。

在一些大資料征信的文章中,一些案例是這樣分析個人行為和信用評分的關系的:經常半夜上網的使用者可能被認為沒有穩定的工作而降低信用評分,購買大件家具的使用者可能提示有固定房屋資産而使其信用評分較高,微網誌更新頻繁的使用者可能因為社交活躍而信用評分較高等等。但這些因素并不十分穩定且準确,有些行為可能隻是使用者的個人習慣,如果過度依賴這些因素将對使用者信用的判斷産生誤差。是以,哪些行為可以成為判斷個人信用的标準需要考量。

是以,大資料能夠成為金融機構的征信參考标準并不一定要求資料量大、資料的次元多,資料的有效性高、資料更能反映問題才能讓征信更加全面、可靠。

本文轉自d1net(轉載)

繼續閱讀