天天看點

不論是大資料還是小資料,有用的就是好資料!

筆者每一天都會聽到這樣的問題:「我到底需要大資料嗎?」實際上,站在管理的角度上,資料越小越好。從這個方向出發,你或許并不需要大資料。但不論如何,在特定情況下大資料其實非常有用。

大資料

  大資料到底有多大?

在 2001 年,道格 · 萊尼(doug laney)寫下了一篇具有開創性意義的文章。在這篇文章中,萊尼描繪了一直困擾着他的客戶的一個資料問題。萊尼的客戶受困于體量(volume)過于龐大的資料,這些資料正在以爆發式的速度(velocity)增長,同時資料所呈現的形式也非常多樣化(variety)。萊尼的體量、速度和多樣化理論得到了廣泛認可,并被稱為「大資料的三重奏」。

遺憾的是,許多人并沒有抓住萊尼的重點。他在文章中所描述的是大資料所蘊含的問題,而不是優勢。

想要收集大資料其實并不容易,而且收集和使用的成本往往非常高昂。與此同時,在一般情況下大資料和具體商業問題的關聯度其實并不明顯,遑論大資料往往不能滿足品質标準的要求。況且在面對大資料時,管理資料所投入的資源并不能在分析、二次研究以及執行等環節中使用。由此看來,大資料對于許多人而言其實并不是一個祝福。相反,大資料有可能會嚴重攤薄企業在資料分析環節所需要的資源。

  大資料思維

和其他問題相比,某些問題往往會顯得更加重要,而某些問題則往往會顯得更為複雜。但即便是在解決那些非常重要或複雜問題的時候,我們也不一定需要體量龐大的資料。

我最喜歡的例子之一是載人航天計劃,你隻需要考慮想要活着将人送到太空所需要的所有資訊和計算,就不難了解這是一個多麼複雜的問題。載人航天任務所涉及的資料包括:

宇航員的身體狀況和醫學資訊

地理測量學(航天器的位置)和重力場

氣象學,雲層量和輻射平衡

大氣實體學

磁場強度

宇宙射線和輻射捕獲量

電磁輻射(紫外線、x 射線和伽瑪射線

這份清單隻是所需清單中的一小部分,但它所包含的資訊量已經非常龐大。甚至連筆者本人也不清楚這些資訊到底意味着什麼,他隻是從一份老舊的 nasa 檔案中找到這份清單。(有誰知道行星際媒體的測量方法嗎?)

載人航天計劃所需要的資料到底有多少?與之比對的計算能力又該有多少?這兩個問題的答案你能猜出來嗎?

筆者曾有幸和「水星計劃」(mercury project,美國第一個載人航天計劃)的程式設計人員露西 · 西蒙 · 拉科夫(lucy simon rakov)進行會談,她向我描述了項目所使用的電腦。據拉科夫描述,盡管項目中的電腦性能非常強大,但記憶體卻隻有 300 千位元組。你沒有看錯,不是「艾位元組」,不是「拍位元組」,也不是「兆位元組」,而是「千位元組」!

換而言之,隻要你足夠聰明,你就可以憑借記憶體極小的裝置将航空器送上太空,要知道 300 千位元組的記憶體甚至連存儲一張大一點的圖檔也不夠。由此看來,小小的空間其實也大有所為!

盡管如此,大資料有時會變得相當寶貴,與其價值相比,進行中的煩惱和成本甚至也變得不值一提。

  大資料有什麼好處?

大資料可以針對使用者提供定制化的細節資料,有了這些資料,你可以作出更加明智的決策。實際上,有了大資料的幫助,你在頃刻間即可完成上千項決策。

如果說你可以一個接着一個地觀察使用者,你會更了解他們的習慣、喜好和需求。你會更了解如何和他們相處。隻要資料的準确度和品質得當,大資料可以讓你以定制化的方式與使用者保持親近,就像對待朋友一樣。

你可以通過分析資料中的細節為使用者提供個性化服務,客戶可以從你身上獲得類似于亞馬遜(amazon)或者 netflix 的針對性服務。更加顯著的例子是線上婚戀網站的配對服務。

我需要大資料嗎?

除非你已經可以在工作中善用日常更小級别的資料,否則大資料對你而言還言之過早。更重要的是,不論面對的是大資料還是小資料,最重要的是你可以善用資料,并将其轉化成自己的強力武器。

本文轉自d1net(轉載)

繼續閱讀