天天看點

深入淺出——大資料那些事

深入淺出——大資料那些事

現在,大資料是一個被濫用的流行詞,但是它真正的價值甚至是一個小企業都可以實作。通過整合不同來源的資料,比如:網站分析、社交資料、使用者、本地資料,大資料可以幫助你了解的全面的情況。大資料分析正在變的越來越容易,成本越來越低,而且相比以前能更容易的加速對業務的了解。

大資料通常與企業商業智能(bi)和資料倉庫有共同的特點:高成本、高難度、高風險。以前的商業智能和資料倉庫的舉措是失敗的,因為他們需要花費數月甚至是數年的時間才能讓股東得到可以量化的收益。然而事實并非如此,實際上你可以在當天就獲得真實的意圖,至少是在數周内。

為什麼使用大資料?

資料在呈爆炸式的速度增長。其中一個顯著的例子來自于我們的客戶,他們大多使用谷歌分析。當他們分析一個長時間段資料或者使用進階細分時,谷歌分析的資料開始進行抽樣,這會使得資料的真正價值被隐藏。現在我們的工具clickstreamr可以收集點選級的巨量的資料,是以你可以追蹤使用者在他們通路路徑(或者通路流)中的每一個點選行為。另外,如果你加入一些其他的資料源,他就真正的變成了大資料。

更完整的解析

大資料并不僅僅是大量的資料。他的真正意義在于根據相關的資料背景,

深入淺出——大資料那些事

來完成一個更加完整的報告。舉個例子,如果你把你的crm資料加入到你網站的資料分析當中,你可能就會找到你早就知道的高價值使用者群。她們是女性,住在西海岸,年齡30至45,花費了大量的時間在pinterest和facebook。

現在你已經被這些知識武裝起來了,那就是如何有效的設定和擷取更多高價值的使用者。類似tableau和谷歌這樣的公司給使用者帶來了更加強大的資料分析工具(比如:大資料分析)。tableau提供了一個可視化分析軟體的解決方案,每年的價格是2000美金。谷歌提供了bigquery工具,他可以允許你在數分鐘内分析你的資料,并且可以滿足任何的預算要求。

大資料是什麼?

由于大資料往往是一個混合結構、半結構化和非結構化的資料,是以大資料變得難以關聯、處理和管理,特别是和傳統的關系型資料庫。當談到大資料的時候,高德納公司(gartner group,成立于1979年,它是第一家資訊技術研究和分析的公司)的分析師把它分成個3個v加以區分:

量級(volume):大量的資料

速率(velocity):高速的資料産出

多樣性(variety):多種類型和來源的資料。

正如我們所說,大部分的企業每一天在不同的領域都在産出大量的資料。這裡給出一組樣本資料的來源及類型,他們都是企業在做大資料分析時潛在的收集和聚合資料的方式:

網站分析

移動分析

裝置/傳感器資料

使用者資料(crm)

統一的企業資料(erp)

社交資料

會計系統

銷售點系統

銷售體系

消費者資料(例如益佰利的資料、鄧氏商聯的資料或者普查資料)

公司内部電子表格

公司内部資料庫

位置資料(空間位置、gps定位的位置)

天氣資料

但是針對無限的資料來源,不要去做太多事情。把焦點放在相關的資料上,并且從小的資料開始。通常以2-3種資料源開始是一個好的建議,比如網站資料、消費者資料和crm,這些會讓你得到一些有價值的見解。在你最初進入大資料分析之後,你可以開始添加資料源來促進你的分析,并且公布更多的分析結果。想要獲得更多關于大資料細節的知識,可以去查閱維基百科的大資料詞條。

大資料的好處

大資料提供了一種識别和利用高價值機會的前瞻性方法。如果你想,那麼大資料可以提供如下好處:

根據資料背景獲得更完整的情況

利用資料驅動做出更好的商業決策

降低商業風險

市場上最好的解決方案

開發出更好的定制化産品或服務

更好的預測客戶的需求和想法

迅速适應市場

在實時資料的趨勢和預測上更加主動

建立精确的生命價值周期(ltv)、地圖和使用者類型

閱讀更長和更複雜的屬性視窗(用于網站點選流資料)

對通過細分的更複雜的導航進行可視化,并且改善你的轉化漏鬥(用于網站點選流資料)

并不适用所有人

請記住,大資料分析并不适合所有人。如果你沒有安裝并且制定分析中的目标、沒有準備好歸因模型、再營銷和進階細分,那麼你就沒有為大資料做好準備。

如果你把谷歌分析使用到了極限,特别是由于他的采樣資料。那麼你已經準備好接觸大資料的皮毛了。

入門級大資料解決方案

目前有一大批面向企業級的大資料解決方案,比如甲骨文、sap,、ibm、emc和惠普。但是。這篇文章是面向尋找入門級大資料解決方案的中小型企業的讀者。下面我們将讨論資料分析的輸出,并且分享兩個相對廉價的解決方案,進而幫助你開始使用大資料分析。

分析結果的輸出

目前對于大多數企業而言,資料分析主要還是針對核心資料。然而在未來,資料分析将不會采用采樣資料,并且會結合其他來源的資料,使用更加複雜的工具(比如tableau)去分析他。谷歌分析是一個偉大的工具,但是你能獲得的結果目前已經到達極緻了。

彙總資料的第一步往往是你輸出資料分析的過程。

如果你是一個谷歌分析進階版的使用者,這将很容易被推進。因為谷歌分析進階版內建了bigquery功能來幫助企業推動大資料分析。(學習更多的關于資料分析及bigquery的內建,請檢視視訊)

如果你是一個谷歌分析标準版的使用者,也不用擔心。我們已經開發了一個工具,它可以導出未采樣的谷歌分析資料,并且把資料推送到bigquery,或者其他的可以做大資料分析的資料倉庫或者資料工具中。一旦你導出了你的資料,你可以做好準備把它導入到一個大資料分析工具中進行存儲、處理和可視化。這就給我們帶來了最好的入門級大資料解決方案。

谷歌大資料解決方案

深入淺出——大資料那些事
深入淺出——大資料那些事

谷歌bigquery是一個網絡服務,它能夠讓你執行數十億行的大規模的資料集的互動分析。重要的是它很容易使用,并且允許精明的使用者根據需求開發更加大的功能。bigquery采用你容易承受的按需定價的原則,當你開始存儲和處理你的大資料查詢時,每個月的花費隻有幾百美金。事實上,每個月前100gb的資料處理是免費的。随着你需求的增長,你可以拓展你的資料需求,并且為這部分需求買單。最好的消息是,bigquery使得大資料存儲和處理适用于所有人。

tableau大資料解決方案

深入淺出——大資料那些事

tableau提供了4個強大的功能(也許更多)來促進大資料分析和預測分析。

salesforce連接配接器允許你輕松的連接配接crm和銷售資料(更快、更容易的連接配接crm和銷售資料,是以如果你使用salesforce,沒有什麼理由不加入大資料)

谷歌分析連結可以幫助你更容易的建立自定義的儀表盤和報告(然而這個功能依舊需要更新才能變的更好)

谷歌bigquery連接配接器可以快速的分析在谷歌免費的網絡服務中的大量資料。

為任何點選行為的分析添加預測的功能(真正快速的預測)

資料分析師是關鍵

企業想要利用大資料,是需要一個資料分析師的。他必須知道不同資料的用法,并且要授予工具連接配接資料的權限。

當一個資料分析師使用bigquery或者tableau來完成提取和合并資料時,他們可以發現在大型資料集合當中的隐藏的模式。這才是大資料分析的關鍵。它可以是決策者做出更好的決策,并且加強了更精細顆粒度的資料段的識别。

利用這個新技能,你可以發現不同的使用者與網站的互動行為。你可以在谷歌分析中以此來建立新的進階細分規則并且針對你的市場或者網站活動做出更高的價值分析。

發現不明情況内的價值

深入淺出——大資料那些事

你的很多不同的資料隐藏不明的情況,這些是希望被發現并告知的。開始把網站分析、crm、社交資料、位置資料等不同的資料源進行結合。這會使你的資料有了相關的背景,并且允許你通過資料看到一個更加完整的情況。這一定會讓你勝出競争對手。

為了說明這點,我們舉個例子,通過大資料分析彙總社交資料、位置資料、客戶資料、銷售資料,你可以發現在舊金山的社會化媒體的趨勢。這使你可以利用使用者需求的增加來增加特定地區的庫存。

不要忘了大資料分析的黃金法則:關注點,在正确的時間關注正确的商業問題。

<b></b>

<b>原文釋出時間為:2014-03-17</b>

<b>本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号</b>