本文目錄
-
- 一.分析背景和目的
- 二.了解資料
-
- 2.1 資料來源
- 2.2 資料集介紹
- 2.3 字段介紹
- 三.業務問題和分析思路
-
- 3.1業務問題
-
- 3.1.1使用者角度
- 3.2分析思路
- 四、資料清洗
-
- 1)選擇子集
- 2)對列名重命名
- 3) 檢視是否有重複值
- 4) 檢視是否有缺失值
- 5) 一緻化處理
- 6) 資料排序
- 7) 異常值處理
- 五、資料分析和構模組化型
-
- 5.1 從使用者次元分析
-
- 5.1.1 了解資料的整體資訊
- 5.1.2.使用者的活躍度和時間關系
-
- 1)9天的活躍度:通過點選量pv和獨立通路數uv分析。
- 2)24小時内的使用者活躍度:通過點選量pv和獨立通路數uv進行相關性分析。
- 5.1.3 使用平台的時長和購買的關系
-
- 1)9天内初次購買轉化周期
- 2)使用天數和轉化率的關系
- 5.1.4 用群組分析方法和漏鬥模型分析淘寶使用者在各環節的轉化率
-
- 1)使用者角度:用AARRR和漏鬥分析方法分析使用者的流失率
- 2)流量角度:對流量在各環節轉化率進行漏鬥分析
- (1)對浏覽(點選)開始的路徑進行分析
- (3)分析總結
- 5.1.5 用RFM模型分析淘寶使用者價值
-
-
- 1)計算RFM名額,建立RF名額統計視圖
- 2)給R、F名額按價值打分
- 3)計算RF平均值
-
- 5.1.6 使用者的複購率
- 5.2 從産品次元分析
-
- 5.2.1 淘寶平台産品的成交情況
-
- 5.2.2 産品被點選/收藏/加購/購買的情況
- 六、結論和建議
-
- 6.1 結論
- 6.2 建議
一.分析背景和目的
在網際網路的時代下,電商平台提供給網民很多便利,如:提升了購物選擇性、更直覺的展示出各類商品的優惠折扣以及降低了購買成本等等。網購已經逐漸滲透進我們的生活。淘寶是電商圈裡龍頭企業,創造過無數奇迹,如“雙十一”購物熱潮及單日交易額百億元等曆史性的突破。淘寶平台不停的更新疊代,提供了更多的個性化服務。淘寶在2003年創立的,2012年注冊會員近5億,日活躍使用者超1.2億。接下來會通過淘寶2017年11月25日至2017年12月3日的随機使用者行為的資料對淘寶進行使用者行為分析,找出問題并提出優化方案。
二.了解資料
2.1 資料來源
資料集-阿裡雲天池
2.2 資料集介紹
本資料集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之間,有行為的約一百萬随機使用者的所有行為(行為包括點選、購買、加購、喜歡)。資料集的組織形式和MovieLens-20M類似,即資料集的每一行表示一條使用者行為,由使用者ID、商品ID、商品類目ID、行為類型和時間戳組成,并以逗号分隔。
注:此次分析導入10萬條資料進行分析。
2.3 字段介紹
注意到,使用者行為類型共有四種,它們分别是
關于資料集大小的一些說明如下
三.業務問題和分析思路
3.1業務問題
3.1.1使用者角度
使用者活躍度和時間的關系?
使用者的使用天數和購買的關系?
從登陸-點選-收藏/加購-下單的各環節轉換率是多少?
使用者的價值分類?
平台産品複購率情況?
####3.1.2産品角度
平台的商品成交量怎麼樣?
平台産品被點選/收藏/加購/購買的情況?
3.2分析思路
四、資料清洗
1)選擇子集
資料量過大,此次分析選擇10萬條資料作為練習,表名是userbehavior。
2)對列名重命名
此資料集沒有列名,在navicat可視化界面直接修改第一行資料(推薦)或者用sql修改,并添加第一行的資料。
3) 檢視是否有重複值
備份原表資料,統計重複值,發現沒有重複值。
4) 檢視是否有缺失值
統計所有列資料總量,總計數一緻,沒有缺失值。
5) 一緻化處理
時間這一列需要改成日期和時間的格式,增加兩列,友善後續資料分析。
6) 資料排序
通過資料排序能發現更多資訊。把日期列按升序排序,發現在2017-11-25 ~ 2017-12-3範圍外的日期,這些作為異常值在下一步處理。
7) 異常值處理
在2017-11-25 ~ 2017-12-3範圍外的日期有44條,删除44條異常值。至此資料清洗完畢。
44條異常資料
删除異常值
删除後的資料
五、資料分析和構模組化型
5.1 從使用者次元分析
5.1.1 了解資料的整體資訊
在2017-11-25-2017-12-03的9天時間内,淘寶使用者983位,3128個商品類目,64440個商品,4種行為類型即點選/收藏/加購物車/購買。
5.1.2.使用者的活躍度和時間關系
1)9天的活躍度:通過點選量pv和獨立通路數uv分析。
統計9天的pv和uv
圖1
9天種點選量和獨立通路數的變化如圖1,其中11.25/26,12.02/03号都是雙休日,其他5天是工作日。11.25-12.01這7天内pv/uv沒有明顯變化,12.02/12.03兩天pv/uv開始上升。
問題:為什麼12.02/03兩天pv/uv都上升?
假設:雙十二促銷預熱導緻點選和訪客上升
收集證據:
整體的銷量是呈現上升趨勢,12.2和12.3銷量有明顯上升。如果是促銷預熱,浏覽和點選會上升,銷量會在促銷當天和前後1-2天出現上升。現在12.2/12.3銷量就上升,說明不是促銷預熱。平台月初的促銷行為更可能。
結論:雙十二促銷預熱不成立。月初促銷不确定,需要更多資料。
2)24小時内的使用者活躍度:通過點選量pv和獨立通路數uv進行相關性分析。
用mysql統計24小時内的pv和uv
圖2
結論:24小時内點選量pv和獨立通路數分布如圖2,其中2:00-6:00活躍度最低,6:00開始活躍度開始上升,晚上19:00-陵城1:00是一天最活躍階段,其中21:00-23:00是最高峰。這和使用者日常作息一緻。
5.1.3 使用平台的時長和購買的關系
1)9天内初次購買轉化周期
登陸當天購買的使用者數最多,最長的轉化周期是8天,超過8天使用者不會再購買。平均轉化周期是2.7天。
結論:關注浏覽超過3天的使用者,提升使用者購買的轉化。
2)使用天數和轉化率的關系
把使用者按照天數分組并建立視圖:
統計出不同使用天數的使用者數量:
統計不同使用天數的使用者中有購買行為的數量:
從上面圖表中可以看出使用天數越長,使用者購買的轉化率越高。
結論:使用者使用時間越長,轉化成購買行為的機率越高。平台可以激勵使用者每天登陸淘寶,提高客戶購買行為。
5.1.4 用群組分析方法和漏鬥模型分析淘寶使用者在各環節的轉化率
用SQL建立視圖使用者行為統計表:
1)使用者角度:用AARRR和漏鬥分析方法分析使用者的流失率
使用者購買行為流程:點選-收藏或加購-下單,用SQL找出各環節留存使用者。
從上述漏鬥圖分析看到收藏或者加購到下單的環節留存是最低的也接近80%。
結論:淘寶平台各環節使用者的留存率是非常好的。
2)流量角度:對流量在各環節轉化率進行漏鬥分析
首先總結淘寶使用者行為所有路徑和建立流量統計表視圖。
建立流量統計表視圖
(1)對浏覽(點選)開始的路徑進行分析
a.路徑1:點選-購買
統計出這個路徑的産品點選量和購買量,做流量轉化漏鬥圖:
b.路徑2:點選-收藏-購買
統計出這個路徑的點選量,收藏了和購買量,做流量轉化漏鬥圖:
c.路徑3:點選-加購物車-購買
統計出這個路徑的點選量,加購量和購買量,做流量轉化漏鬥圖:
d.路徑4:點選-收藏-購物車-購買
統計出這個路徑的點選量,收藏量,加購量和購買量,做流量轉化漏鬥圖:
由上圖發現加購量比收藏多,出現轉化率異常情況。
e.上述路徑中異常問題分析
問題1:為什麼點選-收藏-加購-下單中的收藏-轉化的環節出現異常?
假設:一般使用者隻會收藏一次,加購可能多次
收集證據:用sql查出這個路徑的所有資料(下圖)
發現部分産品收藏次數一般隻有一次,但是加購會有多次。
結論:假設正确,異常原因是一般使用者隻會收藏一次,但是加購可能多次。
問題2:為什麼點選-購買的流量轉化率很低?
假設1:平台推送的和使用者喜歡的産品不一緻。
收集證據:
a.單個商品點選前10和銷售量前10商品對比
由上圖對比分析得到點選量top10的商品和購買量top10的商品不存在重合。
b.商品類目點選前10 和銷售量前10類目對比
點選量top10和購買量top10重合的商品類目ID
通過a和b分别對比分析發現,點選量top10和購買量top10的商品中沒有重合的;點選量top10和購買量top10的商品類目有5個重合,占據總購買量263的48%。說明平台推送的單個商品和使用者偏好的商品不吻合,平台推送的類目和使用者偏好的類目重合度占48%。這個表現是非常差的。
結論:假設1正确。
假設2:商品銷量過低,不能吸引使用者購買。
收集證據:
查找購買次數top10的商品
銷量top10的商品購買量不超過5件,銷售量非常低,無法取得使用者信任,不能吸引使用者購買。
結論:假設2正确總結:點選-購買路徑中,流量轉化率低的原因有2方面:一是平台推薦的準确率低,推送的産品和使用者偏好的産品不一緻;二是沒有爆款,大部分已售産品銷量低,不能吸引使用者信任和購買。
(2)對未浏覽(0點選)開始的路徑分析
a.路徑1 :收藏-下單,整體轉化率1.13%
b.路徑2:收藏-加購-下單,整體轉化率3.03%
c.路徑3:加購-下單,整體轉化率3.24%
d.路徑4:直接下單
(3)分析總結
對浏覽(點選)開始的4條路徑進行對比分析:橫向對比,點選-購買這條路徑吸收了最大的流量,點選量占90.8%,訂單量占據82.4%;縱向對比,點選購買的轉化率是最低的隻有2.02%,點選-加購-下單有9.16%,點選-收藏-加購-下單有9.13%,點選-收藏-下單有4.37%。
對未浏覽(0點選)開始的路線進行對比分析,直接下單的訂單量路線占據86.2%,是使用者0點選路線的主要方式。結論:淘寶使用者下單偏好使用行為更少的模式。點選-購買和直接購買是使用者最喜歡用的方式。其中點選-購買的轉化率過低。
5.1.5 用RFM模型分析淘寶使用者價值
RFM名額:
*
• 最近一次消費時間間隔(Recency):使用者最近一次購物到2017年12月4日的內插補點
*
• 消費頻率(Frequency):使用者在2017年11月25日到12月3日的購買次數
*
• 消費金額(Monetary):資料集中沒有金額,是以消費金額不分析
1)計算RFM名額,建立RF名額統計視圖
2)給R、F名額按價值打分
确定RF打分标準,給每個使用者打分并建立使用者RF打分表視圖
确定打分标準
RF打分統計表
3)計算RF平均值
##### 4)按照RFM使用者分類規則給使用者分類
*注意:将最近一次消費時間短和消費金額高的分為A級客戶,最近一次消費時間長和消費金額低的分為C級客戶(快流失或者已經流失),其他屬于B級中間客戶。
根據RF值建立RF價值分類表視圖:
根據RF價值分類表建立使用者價值分類表視圖:
統計不同等級和價值的使用者人數:
結論:淘寶平台在2017.11.25-12.03期間活躍使用者983位,下單使用者681位占比69.3%。其中A/B等級使用者474位占下單使用者69.6%,占比良好。重要/一般價值客戶占下單使用者24.67%;重要/一般發展客戶306位,占44.9%,這部分占比最大;重要/一般挽留客戶占27.2%;重要/一般保持客戶占1.76%。根據不同價值和等級的客戶采取不同的營銷政策,精細化營運。對占比最大的客戶群要重點培養。
5.1.6 使用者的複購率
計算複購率:在某時間視窗内重複消費使用者(消費兩次及以上的使用者)在總消費使用者中占比
結論:淘寶使用者整體複購率有66%,淘寶使用者留存表現良好。
5.2 從産品次元分析
5.2.1 淘寶平台産品的成交情況
統計被購買過的商品數量
從5.1.1中得到商品總數64440,被購買過的商品僅僅占3.26%。大量商品處于無人問津的狀态。要優化平台商品,推動入駐商家激活沉睡的商品。
5.2.2 産品被點選/收藏/加購/購買的情況
統計不同産品類目被點選的次數、被放入購物車的次數、被收藏的次數、被購買的次數
對上面列進行相關性分析:
相關性分析
回歸分析
從相關性分析表和回歸分析圖可以看到,商品被購買次數和商品個數、被點選次數、被收藏次數、被加購次數都有弱相關性,其中商品個數、被點選次數、被收藏次數、被加購次數都有強相關性。結論:商品類目下的的商品個數越多,點選量越多。結合上面客戶主要路徑點選-購買,增加商品個數,提高點選量,才能提高客戶購買數量。
六、結論和建議
6.1 結論
1)使用者在一天中最活躍的階段是19:00-淩晨1:00,其中21:00-23:00達到最高峰。
2) 使用者使用淘寶的時間越長,轉化成購買行為的幾率越高。初次浏覽到初次購買的平均轉化周期是3天。
3)淘寶的使用者留存率非常好。整體複購率有66%。
4)淘寶使用者偏好行為少的購買模式,點選-購買是使用者最喜歡的路徑,但是轉化率過低。點選-購買的轉化率低有2種原因:一是平台推薦的準确率低,推送的産品和使用者偏好的産品不一緻;二是沒有爆款,大部分已售産品銷量低,不能吸引使用者信任和購買。
5)平台上商品類目下的的商品個數越多,點選量越多。結合使用者主要的路徑點選-購買模式,增加商品個數,提高點選量,能提高客戶購買數量。
6)平台上被購買過的商品僅占3.26%。大量商品處于無人問津的狀态。要優化平台商品,推動入駐商家激活沉睡的商品。
7)10萬資料中,2017.11.25-12.03期間在平台的活躍使用者983位,下單使用者681位占比69.3%。其中A/B等級使用者474位占下單使用者69.6%,占比良好。重要/一般價值客戶占下單使用者24.67%;重要/一般發展客戶306位,占44.9%,這部分占比最大;重要/一般挽留客戶占27.2%;重要/一般保持客戶占1.76%。
6.2 建議
1)在一天中使用者活躍度低的時間段做促銷預告,提升活躍度高的時間段的購買率。
2)建立使用者打卡激勵制度,通過獎勵吸引客戶長期打卡,提高使用者的活躍度,最終提高購買率。
3)優化平台推送産品的規則,提高産品推送的準确率。通過資料庫精準分析使用者畫像,力求把使用者最需要的産品展現給客戶,打造爆款産品積極引流提高店鋪其他産品的購買量,進而提高點選-購買的轉化率。
4)優化平台商品,優化産品推薦規則,積極教育訓練賣家對店鋪的營運。要促進賣家對上架産品的優化,提高産品介紹的完整度、圖檔清晰度、關鍵詞比對度,豐富産品明細,下架粗糙産品,激活沉睡商品。
5)對不同價值和等級的客戶采取不同的營銷政策,按照下面的方法精細化營運。對占比最大的客戶群要重點培養。淘寶使用者占比最大的是重要/一般發展使用者,采用促銷互動,提供優惠券等方式提高使用者的使用頻率;增加品牌商品和優質店鋪的推廣,提升使用者的消費,促進轉化。
*
• 重要價值客戶(A):優質客戶,提高滿意度
*
• 重要發展客戶(A):購買頻率低,提高購買頻率
*
• 重要保持客戶(B): 最近無購買行為,主動聯系,促進使用者購買,以防流失
*
• 重要挽留客戶(B):潛在的價值客戶,重點挽留
*
• 一般價值客戶(B):忠誠使用者,消費金額低,引導進行消費更新
*
• 一般發展客戶(B):新使用者,利用低門檻優惠券,組合優惠券吸引提高使用頻率
*
• 一般保持客戶©: 購買頻率高,最近無消費和消費金額低,不在優先級上
*
• 一般挽留客戶©:流失使用者,短信聯系,推送優惠等召回使用者