LinkedIn：我們下一步要做的是資料産品矩陣化

本文根據美國linkedin公司的資料分析部資深總監simon zhang在3月7日的阿裡巴巴西湖品學大資料峰會的演講整理而成，他着重分享了linkedin對體内資料的搭建、産品化和矩陣化的構想。文章未經演講者審閱。

現在的大資料的後面是個大冰川，海平面上的普通人一般能看見，海平面以下是專業人士能看見的。linkedin内部大約有起碼20種不同的資料庫，就是完全不同的技術的資料庫，還不包括同樣一種資料庫有不同的應用。但實際上我們真正的内部企業使用者，包括linkedin本身，需要的不是一個大冰川，需要的最後是冰激淋，就想把結果出來就行，他不需要大冰川。

怎麼能做到這個冰淇淋呢？咱們講講資料分析的變革。基本大資料分析的三個原則，這個基本的原則是我大約加入linkedin9個月以後我們決定下來的。我們如果要做一件最重要的事的話，那個事需要有三個屬性：

第一個簡單，他出來的結果必須要非常非常簡單，沒有任何花哨的東西，任何人都能夠看明白看懂。

第二個迅速，就是剛才說的速度的問題，越慢結束度越低，越快接受度越高。當然在linkedin使用的是藍圖法則，3秒鐘的法則。

第三就是要規模化，規模化各這的角度來說，我們當時思考的方法是這樣的，希望linkedin内部所有的員工每一個人都能夠用資料來分析幫他們做決策，很快的做決策。

怎麼做到這一點？

第一步，我們需要建立一個真正的金字塔。分析師不應該從資料開始，他必須要從客戶、産品、市場、銷售開始，也就是說明白公司怎麼能做到這件事。他必須要明白如何在這種層面标記未來的事物，标記比資料本身重要得多。分析師本身要分析自己以後要分析什麼，這樣才能把正确标記加到資料庫裡面去。他還必須要明白，資料庫之間的公用，流程，每種資料是怎麼分工的。

下面就幹活了。在linkedin有一個不成文的共識，你做的東西不僅僅是有趣是不夠的，必須要注重執行性。我分析到這個結果以後到底能做什麼，這是很重要的。說完了做以後咱們就走到決策，決策本身一定要實作增加商業的價值，或為團隊增加價值。

第二步是規模化。需要用科技來把金字塔變成一個非常小的底，而大的中心，最小的一個尖的一個過程。舉個例子，linkedin我待的九個月之内和另外一個同僚合作，完成了500個不同的需求項目和模型，但是當年我們其實直接支援兩百個人，500÷200，每年我才回答2.5個問題，這絕對是非資料驅動。後來我們決定是把整個做一個系統，來模拟以前我們兩做的大部分工作，這個系統響應3秒鐘，簡單的規模化了，大概花了三個月，五個人，在内部支援銷售的，在今天為止每天這個系統可以服務1000個銷售員工，大約用這個系統十次，用一次大約時間是3秒到一分鐘，這個系統一天就能做到以前我們兩個人做不到的事情，這就是一個規模化的結果。當年出來結果是我們銷售增長了175個百分點。

第三步，産品化。内部的東西大緻做到ok了，就要把内部積累的這些實踐、經驗和産品和規模化的東西，要做到網站上去，要進來大量自然的使用者、企業的使用者，比如說我們前面講的那個支援内部銷售的分析系統，在去年linkedin就對外開始了一個新的業務，用資料幫助全世界所有的銷售人員變得更有效率。

第四階段，不斷的開發新的資料産品。我們發現了第一個資料産品後，做第二個就非常容易了，然後第二個産品會利用第一個産品的結果，第三個又用第二個結果，結果造成了資料産品内部的網絡化、矩陣化，推動人與人之間的交流、互動、合作。這就是下一步我們準備要做的，就是把所有的産品關聯起來，讓它們互相提供價值。實際上這都是建立在一個平台上面的，資料是一緻的，産品是多樣性的，服務的對象既是同一個人又是一個同樣一個人不同的面，比方說，作為一個父親來說需要為我的孩子花錢上學，我作為上班族來說我需要買汽車上班，是以人的需求是不同的，做同樣的産品挖掘不同的資料。

原文釋出時間為：2014-03-09

本文來自雲栖社群合作夥伴“大資料文摘”，了解相關資訊可以關注“bigdatadigest”微信公衆号

LinkedIn：我們下一步要做的是資料産品矩陣化

繼續閱讀

淺談企業活動中進行資料分析的重要性

Linxu常用指令技巧彙總

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艱難安裝LDAP,SSL認證

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

MySQL的4種隔離級别？出現問題

XX系統實施過程問題總結

無元件上傳圖檔到資料庫中，最完整解決方案

【MySQL資料庫】資料庫索引事務1.索引2.事務

neo4j之cypher使用文檔

Ambari介紹和架構原理

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

登入plsql 報錯 the account is locked --使用者被鎖

SequoiaDB巨杉資料庫C++驅動概述

win10本地scala和spark安裝安裝scala安裝spark