天天看點

大資料應用之資料畫像建設

大家經常聽到一個詞,叫做“畫像”,結合具體對象就是:“使用者畫像”、“商品畫像”、“産品畫像”、“資産畫像”……特别是大資料時代下,在實際企業中,利用大資料進行“畫像”建設是企業經營的基礎,建設企業競争優勢重要的工具之一,當然也是大資料在企業應用最價值重要的場景之一。

去評價一家企業資料化營運程度,或者說資料驅動程度,或者說是否是用“資料說話”。也許嘗試問下面幾個問題可以進行評估:

1、是否建設了“畫像”?

2、“ 畫像”體系建構程度,針對什麼對象進行了畫像。

3、如何應用已經建構好的”畫像”,已經建構畫像的各種标簽與名額。

4、……

畫像為什麼對企業那麼重要,如何進行畫像建設,我會後續把相關經驗分享給大家,這篇文本更多從一些案例,讓大家對于使用者畫像建設有直接的感覺。

标簽是畫像建設的基礎

畫像的建設過程分成下面幾部分:

大資料應用之資料畫像建設

在畫像建設中,标簽的建構是關鍵。本文重點來講資料标簽的建設。标簽是各類資料名額結合具體的應用/業務場景來建構,如果沒有應用場景建構出來的标簽往往就很難“落地“。

我們下面講二個案例來說明資料标簽建設過程:

案例一:使用者的商品價格偏好标簽

某公司的業務團隊想要了解使用者的消費偏好是怎麼樣的。當業務團隊說我們要建構使用者消費偏好畫像的時候,往往是指各種場景下使用者是如何選擇做出選擇的,是以需要具體把偏愛畫像拆分成幾個不同資料标簽:

大資料應用之資料畫像建設

我們以價格偏好為例,也就是說使用者的在購物時候偏好于哪個價格帶的商品。對于價格帶的偏好,建構步驟如下:

取使用者曆史購買消費記錄,統計使用者曆史購買商品的價格,然後對價格進行區間劃分。看使用者購買的價格帶主要集中在哪個區間中(價格帶偏愛應該是一個相對動态的标簽,更新頻率可能一個月需要定期更,而且選擇的時間段也應該是過去某個時間,不應該選擇過長時間段。大家想想為什麼?)。如何進行價格區間劃分?

方法一:按統計學的方法:

1、 按分位數進行。例如:25%,50%,75%

2、 按等箱原則。劃分幾等分

3、 看資料的分布。

4、 ……

方法二:按業務知識經驗

把價格帶按業務經驗,行業經驗進行劃分。

通過資料統計出來,我們可以看使用者是否商品單價是否集中的某個區間範圍内。例如,某使用者購買的商品價格主要集中在30到40這個區間内,根據曆史顯示可以說,使用者可能偏好于購買這個價格帶的商品。當未來我們需要做促銷商品推薦的時候,可以向該使用者重點推薦打折後在這個價格區間的商品。

通過使用者購買的價格區間,以及結合商品所歸屬的品類,可以看這個價格區間在這個品類中屬于什麼級别的。可以進一步給使用者打上:注重品牌、注重高成本效益等标簽。

例如:如果某個品類商品的價格範圍是(5,40],該使用者購物商品主要集中(30,40]這個商品價格區間,使用者在這個品類的消費上都是最高價格區間,說明這個使用者在購買這個品類主要購買的高端商品。這樣又可以為這個使用者打上在這個品類的消費特征标簽:品類高端使用者。

案例二:使用者流失機率标簽

我們經常會聽說一個資料: “養一個新客戶的成本是維護一個老客戶成本的5倍?在利潤貢獻方面,老使用者更是新使用者的16倍”

當然這個5倍更應該了解為期間,更應該了解為:相對争取一個新客,更應該花時間與精力在維護好一個老客上。為什麼呢?(同學們一起思考一下) 做使用者營運的同學對于流失使用者主要痛點如下:

1、 那如何去給使用者打上流失機率的标簽?

2、 如何及時更新這個流失機率的标簽?

3、 什麼時候應該開始需要給流失使用者進行營銷?

4、 針對不同流失機率的使用者是否要設計不一樣的政策?

5、 對潛在流失使用者,應該設計什麼樣的政策?

6、 對不同類型流失特征的使用者,應該投入的成本多少?

對于老客的維護,首先應該及時知道使用者的流失機率多少?随時時間的推移流失機率是否有變動,特别是流失機率高的使用者要及時進行營銷避免真的流失。

流失機率用大資料中機器學習的方法預測,而且根據使用者産生的行為可以實時去計算使用者流失機率标簽(使用者的流失機率應該是動态,是否需要非常高的時效性,還要結合具體開發成本)。通知營運同學根據不同的使用者特征,設計好營銷政策。當使用者滿足相應條件時間,會自動促銷相應的營銷政策,這才是大資料應該有的場景。

我們如何給使用者的流失機率打上标簽呢?如果你的公司的業務比較穩定,公司的業務有一定周期(這個周期多長,要看你公司的業務模式,是對b還是對c),我們會使用機器學習/資料挖掘的方法來去計算這個機率是比較準确的,如果業務太新,資料積累太少模組化型往往不是一個好的選擇。

我們還是以電商為案例背景,這個公司的crm團隊,希望知道使用者流失的機率,根據流失機率定期對相關的使用者進行營銷,降低使用者的流失率。如何建構這個模型進而打上流失機率标簽,主要步驟如下:

業務了解。 與業務溝通分析流失使用者特征,使用者的生命周期定義。例如:多久沒有和公司互動或者交易定義為休眼,多久沒有交易認為是流失了。

業務分析。流失使用者的可能的原因是什麼,根據這些原因,相應去找到或者設計預期名額。例如:如果使用者有過差評,流失可能性高。使用者經常看到公司商品缺貨,流失可能性高。

模型建構。 設計流失使用者的預測模型。根據之前的業務流程,業務知識的梳理,圍繞使用者設計一系列的名額,如下圖所示,會從各個方面進行名額清洗,放到模型中模組化。

大資料應用之資料畫像建設

  來自:資料海洋

本文轉自d1net(轉載)

繼續閱讀