统计与概率入门 · 相关不等于因果

气温把两条曲线一起推高了

冰淇淋卖得越多,水边救援记录也越多。这个表面相关很诱人,但共同的季节性气温才是更合理的解释。

选择一个月份,观察季节位置

滑块只改变高亮月份;所有点仍然保留,便于比较全年结构。

7月 · 31°C
按气温分组查看 先看所有月份混在一起的整体关系。
当前月平均气温
31 °C
高温月份里,两项指标都会被气温推高。

月份趋势

三条线都按各自范围标准化,比较的是升降节奏。

气温 冰淇淋 救援
月份趋势图 气温、冰淇淋销量和水边救援记录在夏季同时升高,在冬季同时降低。

销量与水边记录

混在一起时,点云沿同一个方向上升。

冰淇淋销量与救援记录散点图 按气温分组后,同一气温层里的关系变弱,说明气温是隐藏变量。

整体上看,冰淇淋销量和救援记录有强正相关。下一步把气温层拆开,看看这条关系还剩多少。