産品經理出需求最根本最直接的依據是資料,資料思維是産品經理發現問題、解決問題的必備思維,可以防止自己拍腦袋做決定。
實際工作中,資料的分析方法可以總結為三個大類,正常分析、統計模型分析和自模組化型分析。隻要掌握了這三種分析的方法,就能解決大部分資料分析的需求,甚至可以吧分析需求固化為資料産品,供他人使用。
1、正常分析
基礎的分析需求可以公國唱過分析解決,一般我們可以把資料通過MySQL等資料庫導入Excel,然後在Excel裡直覺的檢視和進行操作,多利用表格、線圖等方法。正常分析較多用到的是同比環比和ABC分析法。
同比環比常見于周報月報等場景。例如很多網際網路公司都非常關心的DAU(日活躍使用者數),用同比和環比來說明就可以比較直覺的了解到剛剛過去的一段時間跟之前相對應的一段時間的DAU變化,若有較大的幅度,則需要分析一下原因。
同比:某個周期時段與上一個周期同時段比較,比如今年5月份的DAU跟去年5月份的DAU相比
同比增長率 = (本周期時段數 - 上周期同時段數) / 上周期同時段數 × 100%
環比:某個周期與上一周期做比較,比如今天環比去年等。
環比增長率 = (本周期數 - 上周期數)/上周期數 × 100%
ABC分析法一般以某一名額為核心,用改核心其他次元的資料與總資料做比較,及各次元資料與總資料的比重,将比重大小順序排列,用不同的标準分為abc三類,比如我們都知道的,世界上80%的财富都掌握在20%的人手裡。其中我們最需要關注的可以成為A類,其次重要的成為B類,最次之的稱為C類。
比如,通過分析資料發現,使用者中,不同年齡段占總使用者的比重是不同的,如下圖,很明顯我們的A類使用者是18-22歲的人群。

2、統計模型分析
模型統計分析我們主要介紹四種分析方法,回歸分析、分類分析、聚類分析、關聯分析
a.回歸分析應用場景:用于預測未來一段時間的某一次元的資料,比如預計明年的DAU。
我們可以了解成幾個自變量通過加減乘除或者更複雜的運算得出的因變量,比如DAU可能跟新增、老使用者、回歸使用者、留存有關。然後根據曆史資料,通過回歸分析形成一個函數,進而得到因變量DAU。回歸分析一般會用
線性回歸、非線性回歸、時間序列等。
b.分類分析應用場景:使用者預測新上線的營銷活動的活動效果、使用者參與度等。
我們可以根據之前活動的資料,分析影響活動效果的幾個因素,把有上線活動時的資料和沒有活動時的資料輸入系統,分類函數就會根據兩類資料判斷哪些因素影響活動效果,常見的分類分析法有
決策樹、KNN分析法、神經網絡算法、樸素貝葉斯算法等
c.聚類分析應用場景:細分使用者,預估哪一類使用者是我們的目标人群。
細分使用者群、細分市場都屬于聚類問題,通過聚類分析,可以更了解使用者的具體特征,進而做更有針對性的營銷。
首先我們要選取聚類變量,盡量選取哪些對産品使用行為有影響的變量,同時需要這些變量在不同研究對象上有着明顯的差異,而且不能有高度相關性,比如年齡、性别、學曆等,将這些變量對應的資料輸入模型中,選取一個合适的分類數目。
之後觀察各類别的使用者在各個變量上的表現,找出不同類别的使用者相對于其他類别的幾個明顯特征,最後進行聚類分析。
聚類分類常用的有
K均值聚類,分布估計聚類等。
d.關聯分析應用場景:判斷哪幾個傷心同時被購買的機率大。
關聯分類在電商中的應用場景比較多,常用的有購物籃分析,屬性關聯分析等。
例如我們分析平台上産生過的有效訂單,購買了牙膏的100人中,有76個購買了牙刷,說明“牙膏 → 牙刷”的可信度為76%,這表示所有購買了牙膏的訂單中,我們的規則有76%都适用。
3、自模組化型分析
當上面的兩種分析方法不能夠滿足我們的需求時,就會采用自模組化型分析,顧名思義,這個方法是根據自己業務的實際邏輯來自己建立一個模型。
例如某公司要估算自己使用者的LTV(生命周期價值),即使用者從進入到流失會給公司帶來多少價值,目的是衡量推廣費用是否可以回收并幫助盈利。
LTV與使用者活躍天數和ARPU(每使用者平均收入)有關,即LTV = 使用者平均活躍天數 × ARPU值。根據業務實際,可以将ARPU拆解成 ARPU = 名額1×參數1 + 名額2×參數2 + 名額3×參數3 + 名額4×參數4.......。使用者平均活躍天數需要預測,ARPU的名額和參數比較明确可以直接代入。
實際上,無論哪種分析方式都是數學模型,也都不能是單獨存在。複雜的工作中,往往需要多種分析方式并存,一步一步的得出最後的結果。且需要我們靈活變通,選擇什麼樣的方法解決問題還是需要深入到業務中去。