安斯库姆四重奏

安斯库姆四重奏(Anscombe’s quartet)是四组基本的统计特性一致的数据,但由它们绘制出的图表则截然不同。每一组数据都包括了11个 ($x$,$y$) 点。这四组数据由统计学家弗朗西斯·安斯库姆(Francis Anscombe)于1973年构造,他的目的是用来说明在分析数据前先绘制图表的重要性,以及离群值对统计的影响之大。
这四组数据的共同统计特性如下:

性质 数值
x的平均数 9
x的方差 11
y的平均数 7.50(精确到小数点后两位)
y的方差 4.122或4.127(精确到小数点后三位)
x与y之间的相关系数 0.816(精确到小数点后三位)
线性回归线 $y=3.00+0.500x$(分别精确到小数点后两位和三位)

参见:Wiki: 安斯库姆四重奏