显著性检验 · A/B 测试

差异是真的,还是偶然的?

把两组访客和转化放进同一个检验框架:先看转化率差异,再用合并比例估计随机波动,最后用近似 p 值判断这次差异是否足够罕见。

α = 0.05
实验数据
A 组 旧版本
B 组 新版本

转化数必须介于 0 和访客数之间。这里使用双侧两比例 z 检验,原假设 H0 为 A、B 的真实转化率相同。

检验结果
H0: pA = pB
正在计算
输入数据后会显示 p 值和检验结论。
A 组转化率 -- --
B 组转化率 -- --
B - A 差值 -- --
合并比例 p̂ -- 按 H0 合并两组估计
标准误 SE -- 随机波动的典型尺度
z 值 / 近似 p 值 -- --

转化率对比

A 组--
B 组--

z 值在零差异分布中的位置

标准正态曲线与 z 值位置 曲线中心表示零差异,两侧虚线为正负 1.96,竖线表示当前 z 值。 0 -1.96 1.96 z = 0
p̂A = xA / nAp̂B = xB / nB;差值看 p̂B - p̂A
p̂ = (xA + xB) / (nA + nB)SE = √[p̂(1-p̂)(1/nA+1/nB)]
z = (p̂B - p̂A) / SE;z 离 0 越远,越不像“真实无差异”下的随机波动。
p ≈ 2 × (1 - Φ(|z|));若 p < 0.05,拒绝 H0。
统计显著 ≠ 业务重要

结论出来后,还要看差值是否足以覆盖上线成本、风险和长期指标影响。