tft每日頭條

 > 生活

 > 統計學怎樣理解置信區間

統計學怎樣理解置信區間

生活 更新时间:2024-07-28 10:21:30

統計學怎樣理解置信區間?置信區間估計也是參數估計的一種,是用一個區間來估計參數值,confidence interval 也就是一定信心下的區間,如95%的置信區間為(0.76,0.96),就意味着有95%的信心認為(0.76,0.96)這個區間包含了總體參數,今天小編就來聊一聊關于統計學怎樣理解置信區間?接下來我們就一起去研究一下吧!

統計學怎樣理解置信區間(白話統計閱讀筆記)1

統計學怎樣理解置信區間

置信區間估計也是參數估計的一種,是用一個區間來估計參數值,confidence interval 也就是一定信心下的區間,如95%的置信區間為(0.76,0.96),就意味着有95%的信心認為(0.76,0.96)這個區間包含了總體參數。

在實際情況下,我們不可能做很多次抽樣,也不可能計算很多個置信區間,絕大多數情況下,我們隻能計算1個置信區間,由于總體參數是固定的,所以确切的描述是區間包含參數,而不是參數落在該區間。

 置信區間與P值的關系

置信區間在作出統計學結論時與P值之間常常有異曲同工之妙,例如對于參數=0的無效假設,如果P值小于0.05,那麼計算的該參數估計值的95%的置信區間一定不包含0,反之,如果P值大于0.05,那麼計算的該參數估計值的95%置信區間一定包含0。

置信區間可以提供比P值更多的信息,如與無效假設的參數偏離有多遠,如無效假設為兩組收縮壓的差值為0,最後計算95%置信區間為(0.1,0.15),這至少提示兩點,首先兩組差異有統計學意義,因為置信區間沒有包含0,第二,兩組總體的差值不大,因為我們有95%的信心認為兩組差值在0.1~0.15之間,這說明盡管結果有統計學意義,但從專業角度來看,收縮壓差别太少,沒有太大的實際價值,這一信息是P值無法提供的。

 利用标準誤計算置信區間

标準誤是樣本統計量的标準差,它反映了每次抽樣樣本之間的差異,如果标準誤小,則說明多次重複抽樣得到的統計量差别不大。

标準誤和标準差之間具有一定的差異,前者是一種誤差,而後者則是對均數的偏離,此外标準差是一個描述性指标,隻是描述原始數據的波動情況,而标準誤則是跟統計推斷有關的指标,描述性指标和統計推斷指标根本不是一個層次上的概念。最後他們針對計算的對象不同,标準差是根據某些抽樣的原始數據計算的,而标準誤是根據多次抽樣的樣本統計量(均數、率)來計算的。

關于均數和率的置信區間的計算公式詳見本書P92。

 Bootstrap法計算置信區間

Bootstrap法幾乎可以用于計算各種參數的置信區間,無論其是否服從正态分布。該方法是利用重複抽樣的方法對參數進行估計的,通過重複抽樣計算得到每個樣本的統計量,随後就可以根據這些統計量計算置信區間,而置信區間的計算又主要用百分位數法,其思想是計算出所有樣本統計量的第2.5百分位數和第97.5百分位數,将其作為95%置信區間。但在估計結果有偏的情況下,就需要借助其他方法了,如本書P94中提到的百分位數t法。

Ref:《白話統計》 馮國雙著

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved