为什么样本量很重要?
做问卷调查时,最常见的问题就是"我需要收多少份?"。样本量直接决定了调查结果的可信度:
- 样本量太少:数据波动大,结论不可靠,领导和客户不认可
- 样本量太多:浪费时间和预算,投入产出比低
- 样本量刚好:用最小成本获得统计意义上可信的结论
三个核心概念
1. 总体(Population)
你想调查的全部人群。比如公司有 500 名员工,总体就是 500。如果调查全国大学生,总体可能是几千万——通常把超过 10 万的总体视为"无限总体"。
2. 置信水平(Confidence Level)
调查结论可靠的概率。常用 95%,表示"100 次调查中有 95 次结论与真实情况一致"。学术研究有时用 99%,快速调研用 90% 也可以。
3. 误差范围(Margin of Error)
调查结果与真实值的最大偏差。常用 ±5%。比如调查显示满意度为 80%(误差 ±5%),意味着真实满意度在 75%-85% 之间。
样本量计算公式
无限总体(>10万)的样本量公式:
n = Z² × p × (1-p) / E²
- n = 所需样本量
- Z = Z 值(95% 置信度对应 1.96,90% 对应 1.645,99% 对应 2.576)
- p = 预估比例(不确定时取 0.5,得到最大样本量)
- E = 误差范围(5% 就是 0.05)
有限总体需要修正:
n_adj = n / (1 + (n - 1) / N)
其中 N 是总体数量。
常用样本量速查表
| 总体数量 | ±5% 误差 | ±3% 误差 | ±1% 误差 |
|---|---|---|---|
| 100 | 80 | 92 | 99 |
| 500 | 217 | 341 | 476 |
| 1,000 | 278 | 517 | 907 |
| 5,000 | 357 | 880 | 3,289 |
| 10,000 | 370 | 965 | 4,900 |
| 100,000+ | 384 | 1,067 | 9,604 |
以上数据基于 95% 置信水平、p=0.5 计算。
实际场景怎么定?
企业内部调查(员工满意度/培训反馈)
总体通常几百到几千人,建议尽量全员覆盖。如果只能抽样,保证 ±5% 误差即可。例如 500 人的公司,至少收 217 份。参考:员工满意度调查指南
客户满意度 / NPS 调查
客户基数大时,300-400 份通常够用。如果要按区域/产品线分组分析,每个分组至少 30-50 份。详见 NPS 指南。
市场调研
面向大众市场,500-1000 份是常见范围。精度要求高的可到 1500+。
快速验证型调查
产品内测反馈、简单投票,50-100 份即可做初步判断。
提高有效样本量的技巧
- 预估回收率:如果预计回收率 60%,目标 300 份就要发 500 份
- 剔除无效问卷:答题时间过短、全部选同一选项的要排除,提前多收 10-15%
- 分层抽样:确保各子群体按比例纳入,避免某类人群过多或过少
- 设置必填题:减少漏答导致的无效数据
快速开始
不用手动计算。选择一个问卷模板,设定好目标人群和发放渠道,RR问卷的实时统计面板会帮你跟踪回收进度。当回收量达到目标样本量时,及时关闭问卷即可。
