tft每日頭條

 > 生活

 > 區間估計的基本原理

區間估計的基本原理

生活 更新时间:2024-06-30 05:43:44

區間估計的基本原理?點估計是給出總體參數的一個具體估計數值,但點估計沒有給出估計量的精度信息,所以我們需要引入置信區間來判斷樣本統計量的精度,下面我們就來說一說關于區間估計的基本原理?我們一起去了解并探讨一下這個問題吧!

區間估計的基本原理(關于區間估計你需要知道的事)1

區間估計的基本原理

點估計是給出總體參數的一個具體估計數值,但點估計沒有給出估計量的精度信息,所以我們需要引入置信區間來判斷樣本統計量的精度。

比如說我們現在估計全國人民的平均身高,用點估計計算出來全國人民平均身高可能是169cm,但是其實真實的全國人民平均身高可能是169.5cm或者168.5cm。所以我們需要用區間估計來估計未知參數的一個區間範圍。

如果我們說置信區間以1-α 的概率覆蓋總體未知參數,這裡的1-α被稱為置信水平degree of confidence,α則被稱為顯著性水平 significance level。區間估計呢實際上就是來求這個置信區間

一般對于置信區間我們有兩種解釋。一種是概率解釋,一種是在實踐中的解釋。

對于置信區間的概率解釋是這樣的,如果我們重複抽樣,然後對于每一次抽樣構建一個置信區間,那麼這些置信區間中95%的區間會覆蓋總體均值。也就是如果我們重複抽樣1000次,構造1000個置信區間,大約有950個區間會覆蓋總體均值。

在實踐中呢,做1000次重複抽樣的工作量過于繁重,所以我們将概率解釋進行了延伸,說我們有95%的把握這個置信區間會覆蓋總體均值。

置信區間的一般公式是

這裡的置信因子是基于點估計的分布假設與置信水平1-α得到的一個數字。

一般我們做區間估計的時候,要麼是總體服從正态分布,要麼是根據中心極限定理,我們得到樣本均值近似服從正态分布,一般來說這兩種情況居多。所以這裡我們隻讨論怎麼去求正态分布的總體均值μ的置信區間。

這裡呢,我們需要分兩種情況,一種是總體方差σ^2已知的情況,一種是總體方差σ^2未知的情況。

當σ^2已知時,μ的置信區間是

前面我們講過Z分布就是标準正态分布,它的均值為0,方差為1。

代表的就是使得标準正态分布右尾剩餘概率為α/2的點處的關鍵值。

比如

,就是數據落在右尾的概率為2.5%。我們可以查表得到

就等于1.96,也就是對于标準正态分布來說,有大約2.5%的數據會大于1.96。

對于标準正态分布而言,這就是從它的均值0向右移動了1.96*1,也就是1.96倍的标準差,類似的,對于非标準的正态分布,我們從均值X ̅向右移動1.96倍的标準差,數據落在剩下的右尾部分的概率就是2.5%了。前面說過,我們稱樣本均值的标準差為标準誤。所以這裡我們可以說向右移動1.96倍的标準誤。

如果我們現在已知總體服從正态分布,總體方差是400,現在我們從總體中抽取100個樣本數據,計算出來的樣本均值是15,求置信水平為95%的總體均值的置信區間。

置信水平為95%,因為正态分布左右對稱,所以數據落在左右尾部的概率都應該是2.5%,這樣數據落在均值周圍的概率才會是95%。對應的

是1.96,标準誤等于

樣本均值等于15,所以置信區間就是15±1.96×2,計算出來就是(11.08,18.92)

當σ^2未知時,如果樣本容量很大,或者樣本容量很小但總體服從或近似服從正态分布,我們就可以用t分布來求置信因子,并且用樣本方差代替總體方差。

所以μ的置信區間是

這裡的原理與使用Z分布時類似,隻是查表的時候略有不同,就不贅述了。

這裡有一個記憶順口溜:

σ^2已知,z分布

σ^2未知,t分布

非正态小樣本不可估計

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved