天天看點

對話Capital One紐約總部資料中心負責人:建構中央資料團隊與業務部門的良性生态

對話Capital One紐約總部資料中心負責人:建構中央資料團隊與業務部門的良性生态

大資料文摘作品,轉載具體要求見文末

大資料文摘記者 | 魏子敏

*本文為清華資料科學研究院聯合大資料文摘發起的《資料團隊建設全景報告》系列專訪内容。

“我們不是一家傳統意義上的銀行,我們也不把自己看作銀行。我們是一家以資訊/資料作為基礎戰略的公司,隻不過我們第一個成功的産品碰巧出現在銀行領域罷了。”(“We are not a traditional bank. We do not see ourselves as a bank. We are a company with an information-based strategy, whose first successful product offerings happen to be in banking.”)

Capital One創始人Nigel Morris在創始之初就為這家金融機構奠定了資料化戰略的基調,他認為,強調資料和資訊技術的戰略不止可以成就一家Capital One,也完全适用于其他行業。而資料化營運的血液也從創立之時就注入在這家公司的文化中。

5月初,大資料文摘跟随上海大資料聯盟一行,到訪了位于紐約的Capital One總部,并對話其資料服務部負責人Mike Walters。之後,團隊還到訪了其位于紐約市中心聯合廣場的第一家Capital One 360咖啡館,身臨其境地感受了其以資料為中心的企業文化。

對話Capital One紐約總部資料中心負責人:建構中央資料團隊與業務部門的良性生态

Capital One資料服務部負責人Mike Walters介紹相關業務

對話Capital One紐約總部資料中心負責人:建構中央資料團隊與業務部門的良性生态

考察團在Capital One 360 café與從業人員合影

Capital One的逆襲:比網際網路公司還注重大資料的金融大佬

自1988年創立之初,Capital One就堅信銀行的競争力是對金融資訊的收集與處理能力,應該運用資訊科技與高頻測試來開發最适合客戶需求的金融産品。在那個甚至網際網路普及率都很低的年代,Capital One管理層已經把資料搜集和分析做到了極緻,這一信條幫助 Capital One成為一家“網際網路時代之前的大資料公司”,并成功跻身全球财富五百強。

對話Capital One紐約總部資料中心負責人:建構中央資料團隊與業務部門的良性生态

Capital One發家自美國弗吉尼亞州Signet銀行(Signet Bank)的信用卡部門。通過不斷尋求技術創新,現在,Capital One已跻身全美最大的銀行之一。截至2015年9月末,資産規模已經超過3000億美元,名列财富世界500強。

以資料為中心的企業文化和員工培養機制,公司高層對資料化營運的支援,都是這家金融企業成功逆襲的必要條件。

中央資料團隊:為業務部門提供技術支援

Capital One作為一家龐大的金融機構,有着多條業務線,而資料化營運滲透進了公司的每一條業務線中。除了在每個業務部門内配有自己的資料團隊外,Capital One還設定了專門的中央資料服務中心來為商業組的決策和工作提供資料技術支援。

資料服務中心負責人Mike Walters告訴大資料文摘,中心會為整個商業部門服務,“團隊組織是按照商業線、産業群組織的,就像多數的技術公司那樣,我們的團隊、機器學習工程師和資料工程師從業務部門獲得業務需求,并為他們尋求解決方案。”

Capital One的資料服務中心4年前成立,目前有超過30位成員,包括資料工程師、資料科學家、機器學習工程師、系統架構工程師、産品經理、靈活專家等職位,并且團隊還在不斷擴大。

“我們一開始也是想建立一個以資料為中心的部門,主要的想法就是解決部門之間的資料互動問題,”Mike如此定義資料服務中心的職能,“雖然各部門都用類似的資料,但是信用卡資料在信用卡部門,銀行資料在銀行部門,還有車貸資料在車貸部門,我們想把這些資料放到一個中心。”

Ivy是Capital One信用卡部門的一位資料科學家,她所在的部門也有一支20人左右的資料團隊。類似這樣嵌入在業務部門中的資料團隊在Capital One的不同部門也始終存在。Ivy稱他們和資料中心一般是進行項目制合作,資料中心為業務部門提供“工程師支援(engineer support)”。“資料科學家、工程師、産品經理大家會一起參加項目相關的會,但我們不會參加他們大組組會,他們也不會參加我們大組組會。”

Mike認為垂直業務線上的資料團隊與中央資料中心各有存在必要。“部門内的資料團隊離業務更近,相關問題更好回報;而對于平行中心化資料團隊,最大的優點是可以将不同業務線的問題集中解決,比如我們的信用卡業務和銀行業務部門,雖然資料不同,但可以用一套架構解決,通過一個類似“委員會”的機構與各個業務部門的負責人形成良好溝通關系,工作也更好開展。”

Mike介紹,在美國,中央資料團隊和業務部門内部的垂直資料團隊都曾出現過,“當經濟好的時候,大家都有些閑錢,是以每個部門就會自己養一個資料部門來做資料工作,當經濟不好的時候,沒有這樣的閑錢,大家就一起共享,中央資料團隊更常見。”

擁抱新技術:建立起資料部門與業務部門的良性循環

“美國的傳統大型金融機構中,像Capital One這樣願意全身心擁抱新技術的不多。”上海誠數資訊科技有限公司首席資料官薛瑞東曾在PayPal工作多年,他認為,在美國,很多金融大佬由于體量大,轉型都比較艱難。“在其他銀行的Shared Tech還隻是負責解決IT Support這些基礎工作的時候,Capital One最為堅決地擁抱技術并邀請技術部門深度介入業務決策和營運。”薛瑞東說。

Capital One的資料服務中心目前幾個核心項目都是把機器學習應用到業務領域,從資料出發,把每個産品放到實際應用當中。“我們組裡的很多成員都是程式員,程式員關注的就是寫代碼,大家認為把産品放到實際應用中也是一件非常有趣有意義的事。”Mike希望建立起一個技術部門和業務部門溝通的良性循環,“當我們這樣做的時候,也赢得到業務部門的信任,願意把這樣的項目交給我們組來一起做。”

Mike舉了一個利用機器學習幫助業務部門處理髒資料的例子。“資料遠比你想象的更髒。”Mike及其服務的業務團隊也跟所有使用資料的團隊一樣,需要解決的最頭疼問題就是資料雜亂無章的問題。

“比如使用者最後得到的信用卡賬單上,商家的名字有可能是非常混亂的,有可能顯示不是很清晰,是以在星巴克消費就有可能不會顯示Starbucks,有可能顯示的是SBUS,然後寫一堆亂碼和資料,使用者看到這樣的賬單就會非常的困惑。”

這個不止是客戶,也是Capital One其他業務團隊非常頭疼的事情,“是以我們用一些模糊比對,看到SBUS這樣比較混亂的資訊比對到非常幹淨的商家表裡面。而這些商家有時候可能不是一對一的比對,是以我們有可能得到很多的結果,因為一個街區裡有可能有很多的星巴克。最後我們就要用到機器學習的方法,找出對應的星巴克,然後把結果放到資料庫裡面。之後如果使用者或者其他業務部門需要,就可以直接去查詢這些資料。”

“沒有哪個資料源是完美的。”關于資料品質問題,Mike的團隊解決辦法是建立起了一套資料源評分系統,在對資料使用後對其進行事後評估,下一次購買的時候優先購買高分資料。

開放思維和金融生态:把銀行開成咖啡館和實驗室

位于紐約市中心聯合廣場的Capital One 360 cafe是Capital One提供銀行服務的咖啡館,或者叫提供咖啡館的銀行。它颠覆了一般金融機構正襟危坐的禁锢感,這家“金融咖啡館”明亮且溫暖,提供咖啡、充電裝置、定期講座,從業人員在輕松的氛圍下和使用者互動,人們可以輕松惬意地享受各種定制化的金融服務。

對話Capital One紐約總部資料中心負責人:建構中央資料團隊與業務部門的良性生态

位于紐約聯合廣場的Capital One 360 café,人們可以在惬意地享受咖啡的同時了解金融服務。

對話Capital One紐約總部資料中心負責人:建構中央資料團隊與業務部門的良性生态

Capital One 360 café的從業人員

薛瑞東認為,盡管這種蘋果風格的銀行是否會取得經濟上的成功還很難說,但Capital One這種勇于變革、始終走在銀行創新第一線的開放思維依然值得所有人深思。

“對技術的擁抱和始終走在變革前列的文化可能就是Capital One僅僅用了30年之内就脫胎換骨成為全美十大銀行之一的秘訣吧。當年在經濟危機之後其他美國大銀行都在收縮戰線整理羽翼,唯有Capital One繼續逆勢成長,技術、資料科學和革新功不可沒。”

《資料團隊建設全景報告》系列專訪

資料驅動時代,資料團隊作為一家公司的核心競争力所在,正受到越來越多的關注。清華資料科學研究院聯合大資料文摘,發起了一次資料團隊全行業調研,對國内外資料團隊發展現狀進行盤點和趨勢預測,我們将在7月初釋出《資料團隊建設全景報告》。

如果你是——

· 相關領域資料科學團隊負責人:

希望分享自己的團隊建設經驗給更多讀者,我們誠摯的邀請您作為深度訪談嘉賓,與我們的記者和研究員就相關話題深入溝通。相關專訪内容将作為重點專題,在《資料團隊建設全景報告》中呈現。請将您的需求和團隊介紹發給我們。

· 對資料科學有自己的見解、具備一定的采訪報道技能:

希望接觸到一線的資料科學大咖,也歡迎加入我們的專訪團隊,請将履歷和相關作品發給我們。

· 資料團隊的一員、和資料團隊一起工作,或者希望了解其他資料團隊的發展現狀和未來:

那麼懇請你花費5分鐘時間點選“閱讀原文”填寫相關調研問卷,幫助我們完成這次調研。參與者均可獲得:最終詳細資料報告完整版;2017年度大資料文摘電子雜志。

聯系郵箱:[email protected]

關于轉載如需轉載,請在開篇顯著位置注明作者和出處(轉自:大資料文摘 | bigdatadigest),并在文章結尾放置大資料文摘醒目二維碼。無原創辨別文章請按照轉載要求編輯,可直接轉載,轉載後請将轉載連結發送給我們;有原創辨別文章,請發送【文章名稱-待授權公衆号名稱及ID】給我們申請白名單授權。未經許可的轉載以及改編者,我們将依法追究其法律責任。聯系郵箱:[email protected]