显著性检验 · A/B 测试

差异是真的，还是偶然的？

把两组访客和转化放进同一个检验框架：先看转化率差异，再用合并比例估计随机波动，最后用近似 p 值判断这次差异是否足够罕见。

α = 0.05

实验数据

A 组旧版本

访客数

转化数

B 组新版本

访客数

转化数

转化数必须介于 0 和访客数之间。这里使用双侧两比例 z 检验，原假设 H0 为 A、B 的真实转化率相同。

检验结果

H0: pA = pB

正在计算

输入数据后会显示 p 值和检验结论。

A 组转化率 -- --

B 组转化率 -- --

B - A 差值 -- --

合并比例 p̂ -- 按 H0 合并两组估计

标准误 SE -- 随机波动的典型尺度

z 值 / 近似 p 值 -- --

A 组--

B 组--

p̂A = xA / nA，p̂B = xB / nB；差值看 p̂B - p̂A。

p̂ = (xA + xB) / (nA + nB)，SE = √[p̂(1-p̂)(1/nA+1/nB)]。

z = (p̂B - p̂A) / SE；z 离 0 越远，越不像“真实无差异”下的随机波动。

p ≈ 2 × (1 - Φ(|z|))；若 p < 0.05，拒绝 H0。

统计显著 ≠ 业务重要

结论出来后，还要看差值是否足以覆盖上线成本、风险和长期指标影响。