条件期望与全期望公式 · 全方差公式

层内波动与层间波动

把总体按条件变量 \(G\) 分成三层。调节每层的占比、条件均值和层内标准差,观察总体方差怎样拆成“层内平均波动”和“层间均值波动”。

层内平均波动
\(E[\operatorname{Var}(X\mid G)]\)

0.000

各层条件方差按层权重加权。

层间均值波动
\(\operatorname{Var}(E[X\mid G])\)

0.000

各层均值围绕总体均值的离散程度。

总体方差
\(\operatorname{Var}(X)\)

0.000

两项相加,等于总体方差。

分布位置与方差拆解

总体均值:0.00

三层条件分布和全方差分解图 上半部分展示三层条件分布的密度曲线和各层均值,下半部分展示层内波动、层间波动与总体方差的相加关系。
甲层条件分布 乙层条件分布 丙层条件分布 总体均值

调整滑块后,这里会说明当前主导方差的部分。

读图要点

层内标准差变大时,单个条件分布会变宽,\(E[\operatorname{Var}(X\mid G)]\) 上升;层均值彼此拉远时,即使每层都很窄,\(\operatorname{Var}(E[X\mid G])\) 也会上升。

权重会改变哪一层更“代表”总体:高权重层既影响总体均值,也放大该层的层内方差贡献。

\[ \mu=\sum_g p_g\mu_g,\quad E[\operatorname{Var}(X\mid G)]=\sum_g p_g\sigma_g^2 \]

\[ \operatorname{Var}(E[X\mid G])=\sum_g p_g(\mu_g-\mu)^2 \]