概率论 I · 离散随机变量与常见离散分布

有放回 / 无放回抽样对比器

固定总体规模 N、成功数 K 与抽样数 n,比较 有放回近似Binomial(n, p=K/N)无放回精确Hypergeometric(N,K,n)

XB ~ Binomial(n,p)E(XB)=npVar(XB)=np(1-p)

XH ~ Hypergeometric(N,K,n)Var(XH)=np(1-p)(N-n)/(N-1)

PMF 同轴对比

横轴为成功次数 x。

蓝:Binomial 橙:Hypergeometric

有放回近似 · Binomial

独立重复试验

均值
6.0000
方差
4.2000

每次抽取后放回,总体比例不变,试验可视为独立同分布的伯努利序列。

无放回精确 · Hypergeometric

有限总体修正

均值
6.0000
方差
3.1899

无放回会让样本之间产生负相关,方差乘上 (N-n)/(N-1)

建模判断

什么时候能近似?

抽样比例 n/N
0.2500
修正因子
0.7595

总体很大且抽样比例小时,两者接近;抽样比例大时方差差别明显。

建模要点:二项分布把每次抽取看作概率固定且相互独立;超几何分布保留“有限总体、不放回”的结构。 当 n/N 变大时,超几何方差会被有限总体修正因子压低,柱状图通常更集中。