“樣本方差要除n-1”,這句話似乎一直糾結在學統計的人心裡。那麼,樣本方差究竟為什麼要除n-1呢?
有的解釋說因為要滿足均值,就隻剩下了n-1個可能;有的人說因為樣本均值用掉了一個自由度,所以隻能除n-1。
下面,我們就從概率論的角度來推導一下為什麼是n-1。
我們之所以要計算樣本方差,是因為希望可以通過樣本方差來表示總體方差,即希望樣本方差的期望等于總體方差。不使用期望解釋的話,就是希望如果不斷從總體中抽取無數個樣本組,最終所有樣本組的方差的均值就是總體方差。
我們先使用除n-1的公式計算樣本方差的期望,此時樣本方差的公式為:
因此,樣本方差的期望為:
因為要使用樣本方差估計總體,所以我們總體均值将總體均值引入到樣本方差的期望中:
因為期望具有如下性質(其中C為常數):
故上式的樣本方差可以繼續化簡為:
我們已知總體方差的公式為:
又知均值的方差為(其中D(X)表示X的方差):
故上式的樣本方差還可以繼續化簡為:
所以當樣本方差除n-1時,樣本方差的期望才等于總體方差,在概率論中稱之為無偏估計。
還可以用如上方法計算當樣本方差除n時樣本方差的期望,最終得到如下結果:
此時樣本方差的期望不等于總體方差,不是總體方差的無偏估計。
作者:長行
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!