天天看點

銀行大資料:非hadoop的架構證明

銀行大資料:非hadoop的架構證明

為啥寫這文章呢?很多人都認為,銀行在大資料方面應用落後,如何跟不上時代,說是支付寶都去“ioe”了,都推出餘額寶了,銀行是否除了雇人出來說餘額寶的壞話就沒啥能耐了等等巴拉巴拉巴拉。但是,筆者真的不是這樣的認為的。

首先,銀行的it系統非常跟的上時代。如果論國内的資訊化水準,銀行的絕對算是數一數二,甚至直接就是數一。哪個公司敢站出來說自己的資訊化比銀行這個行業好?單獨看看那些提供it技術服務的公司(俗稱“外包”,賣人頭)就能知道,這個行業吸收了太多的it從業人員。如果農行不買外協服務,就如同聯通拿掉省級精分資料倉庫一樣,不知道要死多少家it公司。

先看看工行。不久前,前工行楊凱生先生弄了一篇大論,深刻見底。足見銀行it之威武雄壯。

現在工行有17000餘家營業機構,但目前通過網上銀行、電話銀行、手機銀行、自助銀行等管道處理的業務量已占到全部業務量的78%,相當于替代了30000多個實體網點。工行自主研發的核心應用系統支撐了海内外龐大經營網絡的平穩運作,目前日均業務量為2億筆,每秒處理業務的峰值達到6500筆。2012年全年的電子支付結算金額達到332萬億元人民币,結算筆數超過了130億筆。

而對海量的各類資料,工商銀行通過多年的努力,已經搭建起了以資料倉庫為核心的經營管理資料體系,實作了客戶資訊、賬戶資訊、産品資訊、交易資訊、管理資訊等的集中管理,形成了資料标準、資料品質、資料架構、中繼資料、資料生命周期、資料安全以及資料應用等全流程的資料資訊管理機制。積累的資料規模将近300個tb,利用這些資料,建立了4.1億個人客戶和460萬法人客戶的資訊視圖和星級評價體系,開發了34個法人客戶評級模型、75個零售信用評分模型、16項市場風險内部計量模型和17類操作風險資本計量模型。客戶違約率和違約損失率資料的積累長度均在10年以上,已達到巴塞爾資本管理協定Ⅲ的要求。工商銀行還建立了獨立的模型驗證團隊,對資料應用的有效性、準确性進行持續驗證和監控,内部審計部門對驗證情況進行審計。

工商銀行早在上世紀90年代就開始将客戶評級結果用于信貸準入和貸後監測,2005年開始按照新資本協定的最新要求對信用評級方法、系統與流程進行了全面優化,2008年開始将風險計量結果用于風險管理全流程,2010年起進一步将有關結果正式用于貸款品質分類、撥備計提和經濟資本配置設定,并在此基礎上開始實施法人業務和零售業務的raroc(風險調整後的資本收益率)管理,實作了按風險與收益均衡的原則進行授信審批和定價。就拿最近媒體熱炒的網絡信貸而言,截至今年8月末,工商銀行以小微企業為主要服務對象的“網貸通”的貸款餘額已超過2150億元,累放額已近11000億元。

如果,你對上述表述依然不認為工行大資料的能力強的話,請自動退出閱讀。

有人說了,為啥支付寶有那麼牛的技術架構雲雲,殊不知,如果不是銀行開放支付的接口,支付寶的錢存到哪裡都成問題啊。不要忘了,支付寶是不能經營銀行業務的喲。

再看看招行,股份行中的翹楚。主供零售業務。其it的相關架構也是氣勢磅礴。早在1998年,招行就開始了資料倉庫的建設。1998年,招商銀行、奧尊電腦公司、sybase公司經過幾個月的共同協作,聯合開發招行資料倉庫系統,包括人事、儲蓄、會計等系統,成為國内業界第一個成功可用的資料倉庫系統。98年的資料倉庫,資料容量就有156gb。随着業務的發展,特别是網銀的建設,資料倉庫的相關的資料倉庫的系統有了ibm的産品和teradata的産品。也走上了資料倉庫的建設道路。現在招行的微信銀行+網銀+資料倉庫的架構也是标杆性的項目。具體的資料規模還沒拿到,但肯定不會太慫。

銀行對資料的整合利用并實作資料價值,都是基于資料倉庫的架構和核心理念,在早期的營運中,有了先發的比較優勢,但是,随着對私客戶市場的興起,網際網路為首的公司還是帶來了一定的沖擊,但是銀行還是在資料倉庫上越做越好。因為,網際網路抓高淨值客戶的能力還很有限。傳統架構的資料倉庫依然在銀行内扮演重要角色。teradata的産品賣的好就是明證。 

<b>.</b>

<b>原文釋出時間為:2014-03-13</b>

<b></b>

<b>本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号</b>

繼續閱讀