為什麼我們做使用者調研時，樣本量不是50就是500這樣的數字？為什麼不是300，或者是20這樣？作者通過自己公衆号為例，對這個問題進行了詳細的分析，并解釋了背後的理論依據，分享給大家。

教員經常講，你對于某個問題沒有調查，就停止你對于某個問題的發言權。

要注重調查、反對瞎說。

今天某個朋友在問我定性和定量調研的關系，問定性調研為啥是50位，不是30不是100呢？

有沒有理論支撐？

我當時被問住了，尴尬了回了句哈哈哈，好問題。

午飯後，重新思考了這個問題，做一個簡單的梳理。

定性調研：

已購使用者定性調研，有幾個關鍵性的名額要明确。

1、使用者是誰

2、使用者在哪

3、使用者使用産品屬于什麼階段

舉個例子，

我在寫公衆号，我的産品就是輸出關于機器人賽道相關的東東。

那我做定性調研怎麼做呢？

一、使用者是誰

通過背景資料會發現，我的公衆号粉絲男女比例，差不多4：1

那我做調研男女比例也要遵循這個邏輯。

使用者是誰還要包含年齡、職業、收入、等等次元，那個群體多那個群體相對比例也要增加。

那我在訪談時就要側重在26-45的年齡區間。

二、使用者在哪呢？

還是以我公衆号為例，那我的訪談重點區域就在這幾個地方。

繼續拆解，廣東訪談重點在深圳，江蘇訪談重點在蘇州。

三、使用者使用産品屬于什麼階段

1、未使用人群

2、已使用人群

3、重度體驗人群

按照階段再結合地區和使用者分解

3（階段）x2（性别）xN(地區選擇）xS（年齡選擇）

按照我的來看

3x2x4x2=48人

這還沒按照粉絲比例去做調整，那50位是不是算合理呢。

新産品的調研也可以做參考，也是适用的。

定量調研：

500份的調研樣本不代表回收的有效資料，那為啥是500呢？

我們在讀書階段可能都接觸過一部分統計學，在統計學裡有個機率問題。

我不做科普，樣本量其實也有幾個關鍵性名額。

1、置信區間

2、置信水準

3、人口規模

4、标準差

感興趣的自行百度

那統計學中有一個概念叫做Z分數。

Z 分數是統計學中的一個概念，它表示你的分數距離平均值有多少個标準差。在計算樣本大小時，Z 分數代表了你想要的置信水準。

常見的置信水準有 90%，95%，和 99%，它們對應的 Z 分數分别大約是 1.645, 1.96, 和 2.576。

正太分布Z值表是現成，可以看下圖

正态分布Z值表怎麼看呢？

比如，我們想要找到置信水準為 90% 的時候，Z 分數是多少？

90% 的置信水準意味着中間覆寫了總體的 90%，留下兩端各占 5%（100% – 90% = 10%，兩端各占一半，是以是 5%）。

在标準正态分布中，這意味着你需要找到累積機率為 95%（50% + 45%）的 Z 分數。因為從最左端到中間覆寫了 50%，再加上從中間到你的 Z 點的 45%。

使用正态分布Z值表

找到對應的行和列，然後沿着這行和列确定交點，你就可以找到對應的 Z 分數。如果表是從最左側到 Z 點的累積機率，你會找到累積機率為 0.9500 左右的 Z 分數。

好像還是沒聊到樣本量，别着急。

當你了解了這些資訊，自然就會了解到一個公式

1）置信水準（Z 分數）：你需要多大的置信度？這決定了你的 Z 分數。

2）預期的效應大小（P）：這通常是你希望能夠檢測到的最小變化或差異。

通常使用 P = 0.5 作為保守估計，因為這會給出最大的樣本大小。

3）标準差（e）：預期答案的變化範圍。

如果你不确定，可接受的誤差範圍 e 可以用 0.05（即 5%）作為一個保守估計。

假設我們要計算的情景如下：

置信水準是 95%，是以 Z = 1.96

預計效應大小（比例）P = 0.5

可接受的誤差範圍 e = 0.05（即 5%）

我們将這些值代入公式中：

N = (1.96² × 0.5 × (1 – 0.5)) / 0.05² = 384.16

根據計算，當置信水準為 95%，預期效應大小為 0.5，且可接受的誤差範圍為 5% 時，所需的樣本大小大約為 384.16。

用樣本電腦計算，使用者基數十萬人，有效樣本量382就可以覆寫。

使用者基數100萬，有效樣本量384。

使用者基數一個億，你會發現還是384。

神奇不？

沒有調查，我怎麼可能瞎說。

以上

本文由人人都是産品經理作者【new bo】，微信公衆号：【new bo】，原創/授權釋出于人人都是産品經理，未經許可，禁止轉載。

題圖來自Unsplash，基于 CC0 協定。

為什麼使用者調研需要50位定性和500份定量呢

一、使用者是誰

二、使用者在哪呢？

三、使用者使用産品屬于什麼階段