天天看點

車品覺:用資料,更要養資料◆ ◆ ◆◆ ◆ ◆◆ ◆ ◆◆ ◆ ◆

車品覺:用資料,更要養資料◆ ◆ ◆◆ ◆ ◆◆ ◆ ◆◆ ◆ ◆

導讀

大資料很忠誠,它真實記錄人們的每個足迹,深藏功與名;大資料很任性,它的分析有根有據,拒絕流言蜚語;大資料很友好,它提供各種權威參考,它創造綠色經濟,讓我們的生活更美好。世界已經進入由資料主導的“大時代”。再過兩天就迎來一年一次的數博會,小編精選出幾篇關于大資料的優質文章,在本周一一分享給各位。

過去,有一些問題一直困擾着我:“現在的企業擷取資料如此容易,資料的增長速度如此之快,那麼對于企業來說,到底要收集什麼樣的資料?收集多少資料?收集資料的邊界在哪裡?”後來,我在美國遇到一位高人,他認為,過去收集資料很難,而現在擷取資料資源變得越來越容易,但是如果收集資料的出發點不是為了解決問題,那麼收集再多的資料也沒有什麼意義。

同時,許多企業還有一個疑問:“現在收集資料不難,成本也不高,為什麼不先收集了資料再說呢?等以後需要資料來解決問題時,再拿出來用不是也可以嗎?”這位高人同樣也給出了這個問題的答案,他對此持否定觀點,并指出用這樣的理念來設計資料應用注定會失敗。

資料收集是沒有邊界的,我為此也痛苦了好一段日子,比如,收集一個人的生日,雖然可以精确到幾分幾秒,但這麼精确的資料又能用在什麼領域,又能産生什麼價值呢?

事實上,資料是有生命周期的。比如,某網站的母嬰頻道在主動收集使用者的寶寶資訊,包含寶寶生日、性别、小名、身高、體重,這裡我們就要清楚這幾個資料的用途和生命周期,如寶寶的身高和體重,這兩個資料的生命周期很短,過了一段時間後就失效了;而寶寶生日和性别這兩個資料的生命周期就很長,可以從生日的年份中推算出寶寶的年齡,而性别則基本是終生穩定的。

是以說,在收集資料時,我們必須知道這些資料未來可以用來做什麼,如果今天都想不出來的話,日後就更不可能了。

資料應用因小而美

“小”不是指資料量,而是指應用的目标很具體。

2011年年底,作為一名資料分析師,我開始思考怎麼從“用資料”轉變為“養資料”(即從資料化營運轉變為營運資料),這段時間我為收集什麼樣的資料而特别煩惱。而且,我也曾經試圖做出一個特别大且适合多數人使用的資料應用,可是後來發現這在資料應用的起步階段幾乎是不可能的:一是找到可以解決大部分人需求的資料應用并不容易;二是當時公司的資料非常豐富,需要考慮的因素很多,因素之間的聯系又很複雜。

是以,當開發資料應用的時候,資料就等于原材料;當原材料一直處于變化的情況下,做出來的産品就很容易出問題。體會到資料和應用的關系之後,我最後決定從小角度切入,先把小應用做出來,這就是很好的瞄準器。

“小”不是指資料量,而是指應用的目标很具體。許多人在沒有擷取足夠的資料,并且缺乏對資料了解的情況下做出決策,其實是在“享受”自己的無知。打個比方來說,對于一款資料應用,如果我的目的是分辨兩種決策誰更好以及差異在哪裡,這就是一個很具體的問題;但如果我的目标是想知道如何讓公司赢利,這就是一個空泛的目标。

經過這樣的一番周折後,按照小角度切入的想法設計資料應用,就可以做得具體而快速,而且可以避免因原材料的變化而導緻資料缺失的問題。

如何應用架構來做決策

在大資料的背景下,必須考慮資料之間的關聯性。一個單獨的資料是沒有意義的,要把資料放在一個“資料架構”(場景)中,才能看出存在的問題。而且,想要解決的問題越複雜,架構也就越複雜。但是,決策最重要的前提是要從小角度切入,從“小”做起。

對此,我總結了4步走的方法:

首先确定有什麼問題,從解決問題的角度出發去收集資料。

其次,把收集到的資料整理好,放入一個“資料架構”内(這個架構是用來幫助決策者做決定的)。讓決策者用架構更清楚地看到資料與決策之間的關系,比如a公司在架構内要知道競争情況、新老客戶的比例情況等因素以及多種因素之間的關系。

再次,看架構與做決策的關系。比如,a公司與導航網站有三種選擇——完全不合作、部分合作和全面合作。資料分析師就可以根據資料架構告知a公司該怎麼決策。如果發現資料架構與決策不能比對,就必須傳回到第2步。

最後,根據決策行動,然後檢查行動是否達到目的。如果行動後發現根本沒有達到目的,就要檢讨整個鍊條,尋找問題出在哪裡。是資料有問題嗎?還是因為架構不對?或者是決策不對?是否還有資料沒考慮進去?

是以,想要解決的問題越複雜,架構也就越複雜。對于現在多數還沒有開始做資料應用的電商公司來說,架構一開始千萬不要過于複雜,在搭建架構前問問自己:“我目前的問題是什麼?我的決策是什麼?我的架構又該怎樣搭建?”最重要的前提是要從小角度切入,從“小”做起。

養資料,重要的資料戰略

“用資料”更多的是一種方法論,而“養資料”則是一種資料戰略,是基于深入業務了解的更高層次的商業決策。

“養資料”還有一個重要的含義,就是要決定收集哪些資料。這個決定不容忽視,因為這可能是公司資料戰略中非常重要的一個環節。在我看來,被動收集資料的行為是“收集”,而主動收集資料的行為則是“養資料”。再拿上面講到的某電商母嬰頻道的例子來說,如果收集主體是一家醫院,那麼寶寶的姓名、性别、出生年月和媽媽的姓名等資料的收集,就是收集資料,因為在住院檔案和出生證明上,這些都是必不可少的。但是,如果是母嬰用品要針對家庭進行營銷,那麼這些資訊顯然是不夠的,寶寶奶粉的品牌、家庭收入、職業等資訊則需要企業自己主動去收集,而這些資料也就是“養”出來的資料。

養資料通常有兩類,一類是網站自身沒有的資料,需要使用者主動提供的;另一類是公司擁有的,但沒有進行收集的資料。

若要收集公司沒有的資料,在“養資料”時通常需要花費更多的精力和技巧。舉例來說,現在國内外有很多個性化的手機購物應用,當使用者第一次使用這些應用時,界面中會彈出一些問題,通過互動的方式來收集使用者的資訊資料,比如會出幾款衣服,讓使用者挑選哪一款是更喜歡的。這樣,在幾個問題之後,應用就知道使用者的喜好了。還會讓使用者點“贊”,這個點贊的功能,就是讓使用者明确地告訴應用自己喜歡什麼,這樣使用者就可以在過程中,不斷地告訴應用自己的偏好。這樣一來,應用就可以“養”出使用者的核心資料。

對于公司有資料但沒有收集的狀況,則更多的是因為内部資源協調的問題和公司決策的問題。很多提供餐飲和團購類資訊服務的網站,通常會有一個功能是“把資訊通過短信發送到手機”,這樣就不需要使用者進行特别的記錄,不過有些網站會記錄使用者的手機号,而有些網站則不會。我的觀點當然是記錄這些資料,也即是“養”資料,因為這不僅能夠校驗使用者的手機号碼是否有效,還能夠慢慢地建立起企業與使用者的社交關系。

總之,“用資料”更多的是一種方法論,而“養資料”則是一種資料戰略,是基于深入業務了解的更高層次的商業決策,資料養的越早,積累的資料也就越多。養資料同樣也是一種管理和商業藝術,在養之前可能誰也不确定最終會出現什麼後果,但一旦養成,則會産生非常大的商業價值。

原文釋出時間為:2016-06-13

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀