天天看點

社交網絡資料征信的作用你猜有多大?

巨大的信貸市場需求與稀疏分離的資料造成了金融機構征信與風控上的困局。随着網際網路與數字技術的發展,有條件的企業開始了五花八門的征信服務,而民間企業推舉最多的就是社交網絡大資料征信評價。社交征信應運而生自有其作用,但這個作用有多大呢?似乎也沒有達到大家所給予厚望的程度。

業内人士分析稱,目前來說,社交網絡資料作為弱變量資料,其在大資料征信中的作用有限。國内運用人工智能與大資料做征信的初創企業星橋資料董事長丁卓博士表示:“其實,社交資料征信在做360度的使用者畫像刻畫中,其作用大概隻占5%-10%。對于金融行業的評估來說,這些資料不能作為直接的評價參考。”

同時算話征信ceo蔣慶軍告訴雷鋒網(公衆号:雷鋒網),海量的大資料中和個人信用表現即所謂的y變量能關聯起來的實際資料是很薄弱的,這種關聯資料不容易獲得,模組化的資料也是不夠的,當然更不容易開發出成熟的評估模型。

再者,社交網絡上的資料真實性有多高?我們作為社交網絡的主力軍使用者,深深知道朋友圈、微網誌、空間的狀态與評論互動大部分實質可歸結為感性的“秀炫曬”,那麼機器根據預先設定的特征參考提取出信貸機構希望擷取的資料之後,由此而形成結果就是對象的真實使用者畫像了?

去年8月,國外社交巨頭facebook推出了涉足社交大資料征信的專利——當一個使用者申請貸款的時候,貸款方會審查該使用者社交網絡好友的信用等級。隻有這些好友的平均信用等級達到了最低的信用分要求,貸款方才會繼續處理貸款申請。否則的話,該申請即被拒絕。而在此之前,阿裡巴巴旗下螞蟻金服推出的芝麻信用分也在使用人脈關系、消費行為作為評估信用水準的依據。

國内,騰訊征信總經理鄭浩劍日前也闡述了騰訊對于網際網路征信建設的探索,該公司主要依靠大資料與人工智能技術,基于旗下微信、qq等近十億使用者的社交資料來進行征信工作,通過把結構化資料,文本分類,lbs資料,社交網絡傳播擴散等挖掘之後形成使用者畫像刻畫。

然而國際上似乎還有社交征信成功的案例。上述的例子中,facebook的做法因其片面性被《大西洋月刊》評論稱“涉嫌貸款歧視”:有批評人士認為,這項專利重制了曆史上著名的“貸款歧視”做法:“facebook 想要以你的好友名單為理由拒絕貸款”。這在芝麻信用的人脈應用中也是一樣的道理,但芝麻信用征集了消費行為資料作為補充,或者其實是後者為主導。

至于騰訊,騰訊合法獲得的使用者資料大多數都是qq及微信使用者的行為記錄,但這些行為記錄對于征信的利用價值卻很低。那麼,為了達到評價個人的目的,騰訊也許不得不利用使用者的内容資料,而一旦涉及使用者的交流内容記錄,那就有可能像facebook那樣被認為觸及到使用者隐私保護的法律問題。

“實際上,對于根據社交資料分析出的結果,我們隻能将其作為整個信用報告的補充,因為消費者在社交網絡上的關系隻是松耦合,而不像是在企業機構中形成的緊耦合關系,”丁卓解釋道,在企業中每個人的薪酬、流水等都是确信的,但在社交網絡上,内容都是随性的。“是以,社交網絡分析隻能作為征信對象在基礎資料、深度資料以外的餘信資料補充。”

在資料類型中,資料可以被分為強變量資料,即信貸、信用卡、社保、工商等來源于傳統金融機構和政府機構的資訊;和商品生産、流通、消費等環節産生的中變量交易資料,以及社交、遊戲等弱變量資料。

“在14000個資料源、70萬個來自于不同次元的資料變量中,我們結合金融機構的業務邏輯,分析變量的相關性系數,統計出其中從強到弱遞減的變量關系,而社交網絡資料明顯屬于弱相關變量。”星橋資料的核心團隊當中,有12名計算機科學與金融學領域的博士,27名碩士,其首席資料科學家、肯塔基大學計算機博士林振民與團隊一起,對資料變量的系數進行了數年的研究。

最重要的是,nlp(自然語言處理)仍然是個世界級難題,google、微軟也沒有很好的解決方案。是以,目前的機器學習對于社交資料的處理準确度并沒有很高。如果有好的解決方案,意味着整個遷移學習、機器學習領域都會有一些質的進展,同樣,目前利用機器學習、人工智能進行的大資料征信和風控也會随之獲得進步。

丁卓博士坦言,如今360度刻畫中,fico模型的作用仍占到50%左右,而剩下約45%的部分,則有賴于征信對象的交易行為資料來完成。丁卓介紹,傳統金融機構對客戶的信用評級一般依靠fico模型,但這套模型在信貸、信用卡、外彙、民間借貸等強變量金融交易資料的基礎上才适用,“在下沉到年輕使用者和小微企業等客戶的過程中,fico就有很多需要改善的地方。”

這也是星橋付出極大的代價去對接京東、阿裡巴巴、百度等網際網路平台資料,打破資料隔離和資訊孤島的原因。丁博士透露,在談判的過程中,能夠通過第三方中立機構間接實作與其他大公司的資料資源共享,是他們彼此合作的支撐。“大資料的意義在于,能夠通過機器學習、語義分析等技術,把海量資料的相關性計算出來,連接配接起來進行動态分析。”

星橋的客戶包括工商銀行、招商銀行,據丁卓透露:“目前來說,銀行的信貸客戶以大型企業為主,但事實上他們也有擷取新客戶方面的擔憂。因為從長遠可持續發展來看,他們也要擷取更多小微型企業(供應鍊金融)以及年輕使用者群體(消費金融)等的客戶。通過合作我們了解到,很多銀行也想開展普惠金融業務。但由于對這部分客戶掌握的資訊較少,他們不知道怎麼做。他們不了解普惠金融的客戶群的特征,也不知道應該如何判斷這部分客戶的信用評級,因而不敢貿然開展。”

是以,在科技推動金融的發展背景下,适用于大型企業的fico也需要有一個标準再适應市場的過程。“面向年輕使用者和小微企業等建立更符合他們特征的模型,這是未來五年内,銀行與征信機構必須要做的事情。”

本文作者:溫曉桦

繼續閱讀