為什麼我們做使用者調研時,樣本量不是50就是500這樣的數字?為什麼不是300,或者是20這樣?作者通過自己公衆号為例,對這個問題進行了詳細的分析,并解釋了背後的理論依據,分享給大家。
教員經常講,你對于某個問題沒有調查,就停止你對于某個問題的發言權。
要注重調查、反對瞎說。
今天某個朋友在問我定性和定量調研的關系,問定性調研為啥是50位,不是30不是100呢?
有沒有理論支撐?
我當時被問住了,尴尬了回了句 哈哈哈,好問題。
午飯後,重新思考了這個問題,做一個簡單的梳理。
定性調研:
已購使用者定性調研,有幾個關鍵性的名額要明确。
1、使用者是誰
2、使用者在哪
3、使用者使用産品屬于什麼階段
舉個例子,
我在寫公衆号,我的産品就是輸出關于機器人賽道相關的東東。
那我做定性調研怎麼做呢?
一、使用者是誰
通過背景資料會發現,我的公衆号粉絲男女比例,差不多4:1
那我做調研男女比例也要遵循這個邏輯。
使用者是誰還要包含年齡、職業、收入、等等次元,那個群體多那個群體相對比例也要增加。
那我在訪談時就要側重在26-45的年齡區間。
二、使用者在哪呢?
還是以我公衆号為例,那我的訪談重點區域就在這幾個地方。
繼續拆解,廣東訪談重點在深圳,江蘇訪談重點在蘇州。
三、使用者使用産品屬于什麼階段
1、未使用人群
2、已使用人群
3、重度體驗人群
按照階段再結合地區和使用者分解
3(階段)x2(性别)xN(地區選擇)xS(年齡選擇)
按照我的來看
3x2x4x2=48人
這還沒按照粉絲比例去做調整,那50位是不是算合理呢。
新産品的調研也可以做參考,也是适用的。
定量調研:
500份的調研樣本不代表回收的有效資料,那為啥是500呢?
我們在讀書階段可能都接觸過一部分統計學,在統計學裡有個機率問題。
我不做科普,樣本量其實也有幾個關鍵性名額。
1、置信區間
2、置信水準
3、人口規模
4、标準差
感興趣的自行百度
那統計學中有一個概念叫做Z分數。
Z 分數是統計學中的一個概念,它表示你的分數距離平均值有多少個标準差。在計算樣本大小時,Z 分數代表了你想要的置信水準。
常見的置信水準有 90%,95%,和 99%,它們對應的 Z 分數分别大約是 1.645, 1.96, 和 2.576。
正太分布Z值表是現成,可以看下圖
正态分布Z值表怎麼看呢?
比如,我們想要找到置信水準為 90% 的時候,Z 分數是多少?
90% 的置信水準意味着中間覆寫了總體的 90%,留下兩端各占 5%(100% – 90% = 10%,兩端各占一半,是以是 5%)。
在标準正态分布中,這意味着你需要找到累積機率為 95%(50% + 45%)的 Z 分數。因為從最左端到中間覆寫了 50%,再加上從中間到你的 Z 點的 45%。
使用正态分布Z值表
找到對應的行和列,然後沿着這行和列确定交點,你就可以找到對應的 Z 分數。如果表是從最左側到 Z 點的累積機率,你會找到累積機率為 0.9500 左右的 Z 分數。
好像還是沒聊到樣本量,别着急。
當你了解了這些資訊,自然就會了解到一個公式
1)置信水準(Z 分數):你需要多大的置信度?這決定了你的 Z 分數。
2)預期的效應大小(P):這通常是你希望能夠檢測到的最小變化或差異。
通常使用 P = 0.5 作為保守估計,因為這會給出最大的樣本大小。
3)标準差(e):預期答案的變化範圍。
如果你不确定,可接受的誤差範圍 e 可以用 0.05(即 5%)作為一個保守估計。
假設我們要計算的情景如下:
置信水準是 95%,是以 Z = 1.96
預計效應大小(比例)P = 0.5
可接受的誤差範圍 e = 0.05(即 5%)
我們将這些值代入公式中:
N = (1.96² × 0.5 × (1 – 0.5)) / 0.05² = 384.16
根據計算,當置信水準為 95%,預期效應大小為 0.5,且可接受的誤差範圍為 5% 時,所需的樣本大小大約為 384.16。
用樣本電腦計算,使用者基數十萬人,有效樣本量382就可以覆寫。
使用者基數100萬,有效樣本量384。
使用者基數一個億,你會發現還是384。
神奇不?
沒有調查,我怎麼可能瞎說。
以上
本文由人人都是産品經理作者【new bo】,微信公衆号:【new bo】,原創/授權 釋出于人人都是産品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協定。