登陆后访问



H
I
S
T
O
R
Y

为什么样本方差的分母是 n-1?

先把问题完整的描述下。
如果已知随机变量的期望为,那么可以如下计算方差

上面的式子需要知道的具体分布是什么(在现实应用中往往不知道准确分布),计算起来也比较复杂。
所以实践中常常采样之后,用下面这个来近似

其实现实中,往往连的期望也不清楚,只知道样本的均值:

那么可以这么来计算

那这里就有两个问题了:
为什么可以用来近似
为什么使用替代之后,分母是
我们来仔细分析下细节,就可以弄清楚这两个问题。
1. 为什么可以用来近似
举个例子,假设服从这么一个正态分布:

即,,图形如下:

图1
当然,现实中往往并不清楚服从的分布是什么,具体参数又是什么?所以我用虚线来表明我们并不是真正知道的分布:

图2
很幸运的,我们知道,因此对采样,并通过:

来估计。某次采样计算出来的

图3
看起来比要小。采样具有随机性,我们多采样几次,会围绕上下波动:

图4
作为的一个估计量,算是可以接受的选择。
很容易算出:

因此,根据中心极限定理,的采样均值会服从的正态分布:

图5
这也就是所谓的无偏估计量。从这个分布来看,选择作为估计量确实可以接受。
2. 为什么使用替代之后,分母是
更多的情况,我们不知道是多少的,只能计算出。不同的采样对应不同的

图6
对于某次采样而言,当时,下式取得最小值:

我们也是比较容易从图像中观察出这一点,只要偏离,该值就会增大:

图7
所以可知:

可推出:

进而推出:

如果用下面这个式子来估计:

那么采样均值会服从一个偏离的正态分布:

图8
可见,此分布倾向于低估
具体小了多少,我们可以来算下:


其中:

所以我们接着算下去:

其中(证明见此):

所以:

也就是说,低估了,进行一下调整:

因此使用下面这个式子进行估计,得到的就是无偏估计:

声明:文章转自【马同学高等数学】微信公众号,版权归原作者所有,转载仅供学习使用,不用于任何商业用途,如有侵权请联系删除,谢谢。

相关文章

奇妙的数字:巧合数

Posted by - November 10, 2017 1764
世界上,无时无刻不在发生着一些看似偶然的巧合,有让人遗憾的,也有让人庆幸的,在数学上,也有很多的巧合。

数学之美|填色游戏

Posted by - November 09, 2017 2061
人们提起数学之“美”时常意指其抽象涵义,罗素称之为“朴素冷峻之美……庄严纯净,能够达到严格的完美”。然而,人类也一向从数学中发现审美上的...