天天看點

面對大資料分析的各種問題,我們該如何應對?

有人認為大資料隻是一個空洞的商業術語,大有概念炒作的嫌疑。 事實上,大資料隻是對于不同的人有不同的含義。衆所周知,大資料已經不簡簡單單是資料大的事實了,而最重要的現實是對大資料進行分析,隻有通過分析才能擷取很多智能的、深入的、有價值的資訊。

面對大資料分析的各種問題,我們該如何應對?

那麼越來越多的應用涉及到大資料,而這些大資料的屬性,包括數量,速度,多樣性等等都是呈現了大資料不斷增長的複雜性,是以大資料的分析方法在大資料領域就顯得尤為重要,可以說是決定最終資訊是否有價值的決定性因素。那麼在執行過程中通常會遇到哪些問題,我們該如何應對呢?

放慢腳步 回頭看路

初創公司裡的人們仿佛一直在被人念着緊箍咒:“要麼快要麼死。”他們是如此着急于産品開發,以至于他們常常沒有空想使用者對産品的具體使用細節,産品在哪些場景怎麼被使用,産品的哪些部分被使用,以及使用者回頭二次使用産品的原因主要有哪些。而這些問題如果沒有資料難以回答。

你沒有記錄足夠的資料

光給你的團隊看呈現總結出來的資料是沒有用的。如果沒有精确到日乃至小時的變化明細,你無法分析出來資料變化背後看不見的手。如果隻是粗放的,斷續的統計,沒有人可以解讀出各種細微因素對于銷售或者使用者使用習慣的影響。

與此同時,資料儲存越來越便宜。同時做大量的分析也不是什麼高風險的事情,隻要買足夠的空間就不會有系統崩潰的風險。是以,記錄盡可能多的資料總不會是一件壞事。

不要害怕量大。對于初創企業來說,大資料其實還是比較少見的事情。如果正處于初創期的你果真(幸運地)有這樣的困擾,porterfield(本文)推薦使用一個叫hadoop的平台。

及時解答團隊成員的疑惑

許多公司以為他們把資料扔給mixpanel, kissmetrics,或者google analytics就夠了,但他們常常忽略團隊的哪些成員能真正解讀這些資料的内在含義。你需要經常提醒團隊裡面每位成員多去了解這些資料,并更多地基于資料來做決策。否則,産品團隊隻會盲目地開發産品,并祈禱能踩中熱點,不管最終成功還是失敗都是一頭霧水。

面對大資料分析的各種問題,我們該如何應對?

這就像有天你決定采用市場上常見的病毒營銷手段吸引新使用者。如你所願,使用者量啪啪啪地上來了。可此時你會遇到新的迷茫:你無法衡量這個營銷手段對老使用者的影響。人們可能被吸引眼球,注冊為新使用者,然後厭倦而不再使用。你可能為吸引了一幫沒有價值的使用者付出了過高的代價。而你的産品團隊可能還在沾沾自喜,認為這個損害産品的營銷手段是成功的。

這種傻錯誤經常發生。而如果你的企業在一開始就建立起人人可自助使用的資料平台,來解答他們工作中最重要的疑惑,則可以避免上文所說的悲劇。

把資料存放在合适的地方

很多公司把資料發給外包商儲存,然後就當甩手掌櫃了。可是常常這些資料到了外包商手裡就會變成其他形式,而轉化回來則需要不少工序。這些資料往往是某些宣傳造勢活動時期你的網站或者産品的相關資料。結合日常營運資料來看,你可以挖掘哪些活動促成了使用者轉化。而這樣結合日常營運資料來分析使用者使用曆程的方式是至關重要的。但令人震驚的是,盡管任何時期的所有營運資料都至關重要,許多公司仍不屑于捕獲及記錄他們。約一半以上porterfield所見過的公司都将日常營運資料與活動資料分開來看。這樣嚴重妨礙了公司正确地了解與決策。

不拘泥于一個系統

任何一個好的資料分析架構在設計之初都必須滿足長期使用的需要。誠然,你總是可以調整你的架構。但資料積累越多,做調整的代價越大。而且常常做出調整後,你需要同時記錄新舊兩套系統來確定資料不會丢失。

是以,我們最好能在第一天就把架構設計好。其中一個簡單粗暴有效地方法就是所有能擷取的資料放在同一個可延展的平台。不需要浪費時間選擇一個最優解決方法,隻要确認這個平台可以裝得下所有将來可能用到的資料,且跨平台也能跑起來就行了。一般來說這樣的原始平台能至少支撐一到兩年。

不過度總結

這個問題對于擁有大資料分析團隊的公司來說更常見。試想一下,有多少公司隻是記錄平均每分鐘多少銷售額,而不是具體每一分鐘銷售了多少金額?在過去由于運算能力有限,我們隻能把海量資料總結成幾個點來看。但在當下,這些運算量根本不是問題,所有人都可以把營運資料精确到分鐘來記錄。而這些精确的記錄可以告訴你海量的資訊,比如為什麼轉化率在上升或者下降。

人們常常自我陶醉于做出了幾張漂亮的圖示或者ppt。這些總結性的表達看上去很令人振奮,但我們不應該基于這些膚淺的總結來做決策,因為這些漂亮的總結性陳述并不能真正反映問題的實質。

本文轉自d1net(轉載)

繼續閱讀