天天看點

風劍分享 | 隻有資料最懂公司的痛點,指導企業決策走向

在2018中國大資料高峰論壇上,數瀾科技CEO風劍分享了對資料資産化的了解、大資料平台的建設、大資料落地過程中的挑戰,以及資料應用在未來的機遇與挑戰。具體全文摘錄如下:

一、什麼是資料資産化

“資料資産化是數瀾一直秉持的概念并持續在做的事情”。

風劍曾經在負責阿裡巴巴集團大資料業務的時候,見過很多應用場景。他覺得目前大多數的人對資料的認知并不夠,也不能了解資料從哪裡來,有怎樣的價值,以及對未來業務的支撐在哪裡?

舉一個例子,如果我們是一個手機加工廠,我們擁有各個領域和類型的資料,且每天都在産出資料,但除了産出資料外,企業還希望資料能夠直接作用于業務領域,優化業務效果。這就是認知上的差異,即資料到底能帶來什麼價值,把原始的資料,變成業務上能夠使用的資料的過程就是資料資産化。

世界上所有的資産,隻有資料資産是越用越有價值的。因為它的産生和業務之間是若即若離的關系,如果你不使用它,它就會變成了一堆數字,如果你經常使用它,那它就越來越有價值。

我們自己在實踐過程當中有兩個關鍵的技術點:第一點是将資料打通整合。很多家企業都有不同廠家提供的幾十套業務系統,怎麼把這些資料,包括郵件、視訊、語音等給連接配接、打通是目前整個行業都在解決的問題。

第二點是在資料打通之後把這些資料真正有效的組成業務上能夠看見的、可識别的、可使用的資料,這是整個行業都在面臨的特别大的挑戰。

我們把從資料打通到資料組織到資料标簽化,再到資料内部體系化的過程叫資料資産化。

二、大資料平台的搭建與應用

如果從另一個角度舉一個有關資料資産化的例子,就可以了解到平台是如何搭建的。

現在的shopping mall都有探測技術,當顧客來了就會知道這個顧客是誰,這些資料是很有價值的,但它們隻是資料資産,并不是資料資産化。什麼才是資料資産化呢?當有人進出的時候,把這樣的行為的人、物、場景的關系比對,拉到曆史的次元上,刻畫到曆史的每一個時間節點上,這就是一個基于時空次元産生的事件。在所有的時空次元上這個過程本身就是資産化,它能夠帶來的結果就是一個人所有的行為都出現了,比如這個人過去經常一個人到shopping mall吃飯、看電影、逛街。忽然有一天變成了兩個人共同進出,又有一天這個人看完電影去了母嬰店,這就是一個場景下的資料資産化的過程。可以看到原生的資料隻有三個,但是所帶來的資料資産會豐富到幾百幾千幾萬個次元,甚至可以刻畫出一個人買東西是貨比三家還是猶豫不決的購物心理,從資料視角看起來,價值是巨大無邊的,這就是資料資産化。

我們有一系列的方法論來支撐完成資料資産化,第一點需要把這些資料基于場景、基于時空次元串起來,否則就沒有參考價值了。

第二點我們的大資料平台數栖可以對客戶的資料進行加工、開發、模組化等,從業務平台層面來講就是資料data-mapping,怎麼把mapping好的資料做成profile,就是把探測資料到人的整個次元做一個全系的畫像。這就是資料開發。

資料開發的過程不需要改變客戶的知識結構,也不需要改變以往的資料存儲結構,數栖平台是一個全系的、全次元的資料開發平台。有了這個還不夠,還要有大量的資料需要做成标簽體系,但怎麼能快速生成應用,目前還是一個需要解決的問題。

比如做營銷,或者風控還可能是做消費者洞察畫像的,我們把這些叫做資料應用。我們要做一個使用者畫像來洞察這些人是壞人還是好人,利用的就是個人資料資産加資料技術,然後通過算法和模型計算,把這個人畫出來,這就是使用者畫像能力。我們把這種能力封裝進入一個實體,稱之為資料引擎。資料加資料技術構成了資料引擎,然後把各種資料引擎呈現在平台裡面,客戶用的時候特别友善。

以風控引擎舉例,風控引擎裡有很多場景,比如金融、企業、個人等,資料引擎的應用可以随場景變化而變化,在場景裡把資料基于場景特征進行收斂和聚焦,通過标簽加資料引擎快速生成應用。

有了開發平台、資料引擎和自有的資料資産之後,還要打造一個資料應用平台和服務平台,這中間包含三項核心能力,包括data-mapping、data-profile、data-service。如果把這三點結合起來,一個資料平台基本上就成型了。我們整個平台的建構也是依據這個數瀾自有的理論,把判斷的資料放進來,能夠将時空及場景連接配接起來,基于開發平台把它做成一套profile,再基于一套數瀾自有的資料技術把它分割成一些資料服務,無論是to B面向實體店鋪或者企業,還是to C面向消費者,都有合适的應用場景,并最終通過資料平台讓資料活起來、用起來,當然這是我們一直想要實作的理想。

三、大資料的時光倒流理論

這裡的挑戰在于認知data-mapping,資料如何做mapping,實際上在于資料的認知。

我們在做地産行業的資料服務時發現如何利用大資料提升業主的滿意度,這是一個非常需要資料認知的過程。

在大家想象中,提升業主滿意度特别簡單,通過業主有無投訴,有無報修等資料來做分析即可。但是傳統的滿意度分析中使用的都是單一的資料,為業主滿意度提升帶來的價值特别有限。地産公司找到我們時希望能夠用大資料提升業主滿意度,那時候我們提出一個假設,整個地産公司五大服務體,業主、物業公司、供應商、承建商、服務商。如果能把這五大主體之間的關系建構起來,那提升滿意度就可以找到切入點了,比如帶着全家人看一套房子,一共五個人去看,三個人滿意,兩個人不滿意,究竟是滿意還是不滿意,這裡面是沒有量化的标準,也沒有對與錯之分。但是當我把這五個關系之間的實體建構起來,找到任何一個事件的相關資料,這個事件出發交點在哪裡,那我們就能了解了。這就是我們把這種事件驅動起來的能力—資料認知的能力。

舉個例子:比如我買了一個新房子,我不太滿意,我會打電話過去投訴并且報修很多問題。業主會在一個電話中把所有問題都描述清楚,這個過程會産生很多的非結構化的資料,比如業主是否有家人,有小孩,有老婆,有老人等,哪個水龍頭漏水、進而關聯水龍頭是誰生産的、誰服務的、物業公司是誰、服務周期、供貨周期、服務品質等,把所有的資料都串起來以後就會知道這是一個批量問題,還是個性化問題。

再舉個例子,比如業主說“你必須把馬桶給我往左移五公分”,物業公司就會說這個房子是精裝修傳遞的,所有的樓層,甚至整個小區都是這樣的。但業主為什麼要移呢?他會說“我小孩的浴盆放不進去,你說要不要移?”物業可能會說那我給你移,但是這個工程特别巨大,這裡面給出的資訊就是他有小孩,要放一個浴盆給小孩洗澡,這才是問題産生的根結所在。資料要被深度的、多元的洞察,才能逼近事實本質,光靠采樣分析是發現不了這樣的問題。

我把這種能力稱之為基于事件的mapping能力,大量的資料經常都是這樣。不斷地移動每一個時間節點的事件,對到這個時間軸上然後抽取這類事件的共性資料,我們把這種方法,總結稱為時光倒流理論。

四、隻有資料最懂你的公司

很多企業面臨着不知道自己的資料價值在哪裡,以及資料怎麼用的問題。這是資料的産品化應用問題,很多企業會想當然的做出來一個産品然後告訴客戶這個産品可以解決哪些痛點。我跟數瀾的員工講,我們任何人跟客戶談,盡量不要給客戶講我們的産品能解他的業務痛點,因為我們不懂他的業務。地産行業客戶做了幾十年,他們業務的痛點不是我們可以很快了解的。但是資料可以,資料最能懂公司的痛點,甚至判斷公司後續的決策方向。

就像我前面舉的例子,在做地産領域的時候,我把它們的投訴、工單資訊打通之後,我們可以做到用大資料提升業主的滿意度,結果客戶發現自己還可以做好多事情,比如資金管理,供應商能力管理,服務商管理等。業主滿意不滿意,隻有資料能夠知道,我們把這個過程叫基于資料資産化的場景化驅動。我們喜歡跟客戶講道理告訴他我不懂你的業務,但是你的資料能懂你的業務,如果你給我機會讓我把你的資料資産化,你基于這個資料資産來做資料業務的時候你會發現他的發揮的價值會非常高。

我們先倒過來以客戶的業務做牽引,把客戶的資料全部資産化傳遞給客戶來滿足客戶的業務場景。這種應用特别廣泛,我舉一個标簽提示的資料資産給到他,他可以做無數的資料資産應用來分析這個店鋪的流量都去了哪裡,它對我的貢獻有多大,哪一些做資産,哪一些做客戶分析,其實這裡還是一個認知的問題。

我估計在未來兩到三年内,就是國内大部分大資料應用的最大障礙就是對資料的認知和場景化的認知問題。

五、資料應用創業需要聚焦

數瀾目前還是會傾向于傳統公司,因為傳統公司做了幾十年、上百年後,他們很清楚自己短闆在哪裡,應該付出什麼。我們做客群的時候隻做傳統公司,地産,汽車,零售、化工,我們都有涉及。

在資料時代的浪口,有很多的傳統公司趕上來了。網際網路時代很多東西他們已經徹底錯過了,大資料時代它們不希望再錯過資料時代。不聚焦的公司初期可以能還可以,但到後面就會喪失競争力。我們目前主要聚焦在零售和地産,但是也許明年我們的金融事業部就會成立。

六、資料時代是以場景為驅動的

最近跟很多人讨論過這個話題,我們是這樣了解的,我們現在會比較謹慎的提大資料,我們把這個時代叫資料時代。在IT時代的時候,IBM也好、Oracle也好,那個年代所有的核心都是圍繞需求來驅動的,但是資料時代是以場景為驅動的。

判斷一家公司是不是大資料公司就一個标準,你提供的産品是需求驅動還是場景驅動,如果賣一個成熟的産品那就是典型的需求驅動,隻能滿足客戶的一部分需求。但是資料時代的到來就特别奇怪,它偏偏就是以場景作為驅動的,你的資料産品能不能給我提供支撐,我們選擇的時候也比較謹慎,我們這兩天讨論的有一個結論就是在資料時代的初期階段咨詢服務是特别重要的環節,就是一套理論一套方法論不斷地總結、讨論,不斷地告訴他應該這樣做,才可能慢慢地往資料作業系統層面走。

我們認為在未來的兩到三年可能會出現一個拐點,很多參考都是大資料咨詢業務占優勢,業務産品無論做得多好,都是單點業務以外的,包括AI的産品,風控産品做到極緻。更大範圍還是咨詢為主,在未來的兩到三年。我們有3331計劃,在未來的三到五年之内有一大波具有初級,就是通用型的資料産品會出來,它可能以拐點方式來驅動資料的應用,但是不知道這種資料是怎麼樣的,我們也一直在探索這個資料形态。

關于風劍

數瀾科技創始人、董事長兼CEO,頂尖資料應用科學家、國際領先大資料理念的倡導者、國内大資料應用實踐的先行者。

甘雲鋒(風劍),中國國籍,數瀾科技創始人、董事長兼CEO。曾在華為、金蝶、阿裡巴巴擔任過資料架構師、資料科學家、資料業務負責人等職位。2012年即開始負責建立阿裡集團最核心的資料互聯技術(ID-MAPPING)、資料資産體系(TCIF)、資料價值營銷系統(DMP)、城市智慧大腦(AI項目)等;沉澱國際領先的大資料思想及前沿技術研究,奠定大資料應用建設的基礎理論構架,并在此基礎上建構了國内首個較為系統全面的大資料應用平台; 2015年即作為國内首批将大資料理念思想及大資料技術能力靈活應用到各專業領域特别是傳統行業的大資料應用實踐者,獲得超過20多個行業領域客戶及資本市場的認可和青睐。

文章來自數瀾社群,這裡有最全的資料中台/可視化/Hadoop文章等你來唷~

繼續閱讀