天天看點

大資料在P2P借貸上的四大要素

大資料在P2P借貸上的四大要素

       現在p2p借貸領域的許多人,包括我自己,都喜歡使用借貸平台提供的大資料來分析趨勢和幫助自己更好地了解借款人,以及分析他們的行為,進而來控制我們在 p2p借貸市場上的風險。借貸平台的網絡屬性使得許多早期的零售投資者是以技術為導向,是以一直存在着一種誤解就是,要想成為一名成功的投資者,你需要學 會了解并利用大資料。如果你願意自學一些信貸和金融技術來幫助你在p2p借貸領域做出更好的投資決策,你就會知道事實并非如此,而且可謂是大錯特錯 

大資料并不能解決所有問題,你需要了解在關于大資料在p2p借貸上的四大要素。 

要素1:大資料隻記錄過去績效 

任何曾經從經紀人處賣出過(或曾打算賣出)互惠基金、股票、債券或則其他投資資産的人,都聽說過或者接觸過這個條款——過去的表現并不能預示未來 的結果。這是真的,它确實無法預測。那些我們從曆史記錄得到的重要資訊,如支付曆史、fico信用得分和貸款清單上的不良信用者,都隻是向我們展示了我們 的借款人的過去行為。他們是否有按時還貸的曆史記錄?這并不意味着他們将來就會按時清償貸款,但的确,特别是在無重大變化發生時,如失業或者重大疾病等, 清償的可能性會比較高。沒有人知道未來會發生什麼,我們需要記住的是曆史記錄無法預測未來,它隻是過去的記錄。 

要素2:貸款池小且新 

以lending  club為例,它從2006建立至2012年11月發行了它的第一個10億美元的貸款。到2013年5月(6個月後),他們成功發行了第二個10億美元的 貸款。到2013年11月,即他們第一個10億貸款發行一年後,他們發行了第三個10億美元貸款,達到了30億美元的總發行額。這意味着今年的5月至11 月之間,他們發行了另一個10億美元的貸款。所有這些都是從lend academy 上的lending  club月度交易量分析中得出的。這意味着所有貸款中,有2/3的貸款期限都不超過1年。有些人會說我們無法收集任何有意義的資料,但是許多人會同意,我 們能從曆史記錄中擷取最有意義的資料,并分析出早期支付違約的可能性。如果我們能夠擷取所有資料,我們會發現,我們可以用作參考的長期資料貸款池是很小 的。 

我們貸款資産組合面臨最大的問題是早期支付違約,即前六個月以内的違約。我們建立了一個貸款期為六個月以上的20億美元貸款資料庫,用來檢視哪些人延遲支付,以及哪些人早期違約了。而且,由于議定貸款的最新出現,造成擷取那些有意義的資料十分困難。 

要素3:大資料将那些互相影響的因素獨立開來 

資料的有效性十分重要,你可以研究在周二發放,且限定于fico分數為750的ca借款人的債務重組貸款。大資料的一個好處是你可以使用它來研究 任何有意義或具有潛在意義的變量。我們在此讨論的一些變量包括fico得分,不良借款資訊,公共檔案,所在州,房産,受雇年限等等。對我們而言利弊兼有。 好處是顯而易見的,我們可以對這些我們認為重要的因素進行研究,來降低我們的風險。 

問題 

使用大資料研究所有的這些變量所存在的問題就是,它會孤立這些變量,正如如果我想通過公衆檔案來進行核實。起初這聽起來這并不壞,甚至聽起來是件 好事。問題是,這些因素中的一些是彼此相關的,孤立他們來進行研究是沒有意義的,孤立他們會減弱這些變量的價值。例如,信用得分就取決于很多我們之前讨論 的因素,其中包括:最近支付記錄、良借款人資訊、公開呈報、信用調查、循環可用信貸和債務收入比等等。當我們通過信用評分篩選時,我們已經将這些因素考慮 進去了,是以将這些因素割裂開來看實屬多餘,甚至對品質篩選有害。是以,如果我們需要高的信用得分及無不良記錄,同時,我們也知道無不良記錄會提高信用得 分,那麼我們也就是在重複計算這些因素,因而與其他信用相關的因素形成對立。 

要素4:互相關系不是因果關系 

科學家和研究者都深谙此道。也就是說兩件事物相關并不意味着一件事物的發生會引起另一個事物的發生。舉一個典型的例子:我關于通過所在州進行篩選 的主題。我們提到ca擁有最高的違約率。它也擁有到目前為止最多的貸款數量,是以,如果你拒絕ca的貸款,你将會明顯地減少你的可利用貸款池。這也意味着 所有ca的貸款都會因為篩選标準而被排除在外。無疑是一棒子打沉一船人。信用得分就是個很好的例子。自然,公開呈報會降低借款人的信用得分,而且确實是這 樣。然而,這種影響無處不在,可大可小,取決于類别和時間。一個很小的來自五年前的資訊同對一個六個月前的借款人的判斷是不同的,雖然他們都是公開呈報。 前者,由于是在六個月内,是以很明顯地影響了借款人的信用得分,而後者,對分數隻有很小的影響,正如同我們對借款人償付能力的看法是一樣的。 

結論 

你無需成為一個擅長于操縱資料的人,或許你不是這類人更好。因為,當我們考慮所有那些可利用的大資料時,所有人都會很容易掉入陷阱。當我們在進行 資料分析時,如果能夠記得所有這些因素:大資料隻是對過去的記錄而不具備預測性,而我們的貸款池小且新,大資料将互相依存的變量孤立開來,互相關系不意味 着因果關系,我們就會在p2p借貸領域領先于其他投資者一步,并且非常清楚我們貸款組合所面臨的風險。

<b></b>

<b>原文釋出時間為:2014-01-24</b>

<b>本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号</b>

繼續閱讀