天天看點

“上帝指紋”,讓大資料落地

在一個不斷釋放出新概念的技術世界,大概從2012年到2015年,作為一個術語,“大資料”的炒作周期已實屬漫長,人們迫不及待地将它漸次比喻為新時代的石油,金礦和土壤——盡管不同于石油,金礦和土壤,也不同于可穿戴裝置,虛拟現實等同樣擁有旺盛新鮮度技術的目力所及,以資料庫和背景分析為根基的大資料多數時候化于無形,無法讓人輕易觸碰。是以在不少人看來,對大資料概念的熱炒已經進入尾聲,從現在開始,作為商業基礎設施的資料分析将逐漸迎來一個擲地有聲的落地階段。

大體而言,大資料的落地有兩片最肥沃的土壤:第一是可被輕易體察的2c市場,無論電商還是社交,阿裡和騰訊以資料為利器對于個體中心化的追求即是最好的例子;第二是航空,能源,制造,電信,快消等垂直行業,而相比于洞察個體的輕巧與迅捷,資料價值在行業中的落地無疑要相對沉穩——畢竟,了解一個擁有無數細碎分工的行業總要比了解一個具體的消費者困難些,也正因如此,沉穩之後的爆發才尤為可期。

而談及大資料與行業的嫁接,全球四大會計師事務所之一的安永與海雲資料的聯姻則頗具樣本意義。去年底,兩家體量不同卻因資料結緣的公司簽訂的全球戰略合作協定曾在大資料業界引發熱議,就在不久前,後者研發的航空大資料可視化産品diva正式投入商用,它是海雲與安永合作後推出的首款行業級應用産品。透過于此,你會看到當一個行業的資料——或者說行業的知識被可視化之後,會化繁為簡,産生邏輯,産生意義,進而産生價值。

在更大的意義上,如果說大資料是以“上帝視角”還原這個世界,那麼資料可視化則稱得上是“上帝的指紋”。

行業痛點

任何一款産品都從解決行業痛點開始,通常來說,大資料在落地過程中要遭遇三個問題。

首先是資料體量過大且種類繁雜。目前現存資料中,75%都是所謂非結構化資料,包括各種文本,語音,圖像,視訊,社交關系,空間軌迹等,它們異構且分别獨立,如一座座資訊孤島般難以協同工作。而處理和彙總這些多元資訊的最好載體無疑是可視化,一個最淺顯不過的道理是——人類是視覺動物。

嗯,人類層累式進化而來的大腦更偏愛擁有畫面感的資訊。右腦對于圖像的記憶速度要比左腦記憶抽象文字快100萬倍,可視化本身即是強化記憶的手段——它更直抵人心。舉個例子,在我剛看完的電影《史蒂夫·喬布斯》最後,喬布斯指着女兒笨拙的随身聽說:“我要把500到1000首歌裝到你的口袋裡。”這就是一個典型的視覺沖擊場景,他可沒說“我要做個能裝1000首歌的機器。”再譬如,idc研究報告顯示2020年預計全球建立和複制的資訊量會超40zb,沒啥感覺對吧,不如換個說法,2020年全球生産的資料将是地球上所有沙粒的4倍,你會本能腦補沙粒的畫面。

大資料也是如此。知道麼,百度百科對大資料有個慘絕人寰的定義,複制給你:大資料“指無法在可承受的時間範圍内用正常軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資産。”是以說,在實際應用中,與大資料進行視覺對話無疑是聰明之舉。

資料體量過大會導緻第二個痛點:難以分辨随資料洪流裹挾而至的福音與噪音,進而在具體應用中發現有效資料比較少。阿裡巴巴集團副總裁,資料分析師車品覺就寫過一個事:“巧遇到谷歌的前資料部門leader,他跟我說了一件他覺得很痛苦的事:提出資料需求的人往往70%的情況又不用提供給他的資料。他為此非常生氣,便質問業務方:為什麼你們老問我要資料,結果卻不用?業務方回答說:是的,因為我用完之後才知道這些資料沒有用。對于一個每天都要準備資料的人來說,這好比你是一家餐廳的老闆,廚師每天讓你準備很多菜卻隻用一小部分材料一樣痛苦。”

嗯,與老舊的餅狀和柱狀圖止于資料展示(先用資料再去做圖),形式大于内容不同,從互相關聯的過程資料中尋找問題和需求,進而做出動态決策,才是資料可視分析最為重要的技能。

最後,在現實層面,目前在做資料分析的更多是技術人員,離企業業務還有段距離,而至少在現階段,決策層對資料的态度則多少有些若即若離,忽明忽暗——他們很感興趣,卻遠未到離不開的份上。而資料可視化無疑是串聯決策層和資料層的最佳橋梁。

雙赢樣本

上述三個痛點也是海雲資料嘗試去解決的。而作為這家公司核心底層架構産品,已經釋出的圖易4.0(一款自助完成資料可視化的線上工具)即擺脫了傳統的資料倉庫模式,可同時處理結構化資料,非結構化資料和異構資料,能自動對各次元資料生成内部關聯,并以友善的視覺特征完成技術資料與業務決策之間的嫁接。圖易4.0可應用于航空,金融,制造,政府,醫療,快消等諸多行業,其中具體應用于航空行業的衍生産品即是diva。

事實上,作為資訊化程度高,且标準相對統一的領域,長久以來航空行業對資料分析有着巨大需求。據介紹,diva能讓決策層實時了解公司多元度的綜合性資料,通過資料間的關聯邏輯發掘資料價值,以助公司高層做出合理決策。它能把所有航班的資料,乘客資料,飛機資料,地勤和服務保障車輛資料,甚至每個攝像頭資料收集而來并得以應用,目前包括東航,國泰,和馬航在内等不少航空企業都與海雲有過合作。

如前所述,diva是海雲資料與安永合作後推出的首款行業級應用産品(衆所周知,在全球航空行業,安永握有龐大的客戶群),毫無疑問,海雲最為看重安永的,是其113年曆史積累下來的各個行業的知識,相信diva之後,當完成與安永其他領域知識的嫁接,圖易4.0也會延伸出更多産品。誠如海雲資料ceo馮一村所言:“我們建構了一套全新的生态模型,這套模型也形成了閉環,從資料資源開始衍生到算法模型,依靠算法模型落地到行業,形成行業知識,行業知識又會形成新的資料資源,新的資料資源又會有新的算法模型,又導緻新的行業知識。是以會良性地循環起來,變成一個閉環……我們後面要做的就是複制,比如複制到快消行業,金融行業,把這種模式更多地走下去。”

當然,任何合作都是雙赢,對安永而言,作為一家老牌事務所,它也需要抓住時代的步點在商業模式上發力,用更有說服力的資料資訊為客戶作出政策性的管理咨詢和财務交易決策。

是的,回溯過去,那些被網際網路率先影響的行業(比如電商和娛樂)也都被資料化浪潮率先洗禮,那麼接下來,在網際網路+的宏大背景下,大資料應用的下一個落腳點無疑是垂直行業的各自突圍,而資料可視化分析也許将成為它們的标配。

本文轉自d1net(轉載)

繼續閱讀