安斯库姆四重奏(Anscombe’s quartet)是四组基本的统计特性一致的数据,但由它们绘制出的图表则截然不同。每一组数据都包括了11个 ($x$,$y$) 点。这四组数据由统计学家弗朗西斯·安斯库姆(Francis Anscombe)于1973年构造,他的目的是用来说明在分析数据前先绘制图表的重要性,以及离群值对统计的影响之大。
这四组数据的共同统计特性如下:
性质 | 数值 |
---|---|
x的平均数 | 9 |
x的方差 | 11 |
y的平均数 | 7.50(精确到小数点后两位) |
y的方差 | 4.122或4.127(精确到小数点后三位) |
x与y之间的相关系数 | 0.816(精确到小数点后三位) |
线性回归线 | $y=3.00+0.500x$(分别精确到小数点后两位和三位) |