置信區間是指由樣本統計量所構造的總體參數的估計區間。在統計學中,一個概率樣本的置信區間是對這個樣本的某個總體參數的區間估計。置信區間展現的是這個參數的真實值有一定概率落在測量結果的周圍的程度,其給出的是被測量參數的測量值的可信程度,即前面所要求的“一個概率”。
為了進一步說明,看一個例子。
一家食品生産企業以生産袋裝食品為主,為對食品質量進行監測,企業質檢部門經常要進行抽檢,以分析每袋重量是否符合要求。現從某天生産的一批食品中随機抽取了25袋,測得每袋重量如下表所示。已知産品重量的分布服從正态分布,且總體标準差為10g。試估計該批産品平均重量的置信區間,置信水平為95%。
解答如下:
要看懂這個解答,我們需先知道:
所以可以通過使用正态分布統計量 z:
圖一
标準正态分布曲線
本問題中的置信水平為95%就意味着:
圖三
上圖中的兩個不等式是完全等價的,而第二個不等式的計算結果正是本問題的置信區間:101.44g~109.28g。
那麼,整個問題的提出和解決,如何進行描述呢?
一家工廠,想要知道自己生産的所有袋裝食品的平均重量(總體均值),但又不可能每一袋都去稱一下(成本太高),所以采取抽樣的辦法。而樣品的平均值又不能直接作為全部産品的平均重量,所以通過将樣品的平均值轉換為标準正态分布後,再根據置信度的要求,得到一個置信區間,那麼這個區間包含總體均值的可能性就是那個置信度95%。
也就是說,這個問題的本質就是用樣本均值去估計總體均值,每次抽樣以後,都可以由樣本的平均值,按照置信度的要求,得到一個置信區間,而這個區間包含總體均值的可能性剛好就是置信度。
假設置信度為95%,也就意味着,如果抽樣100次,那就可以得到100個置信區間,那麼裡面至少有95個置信區間包含總體均值。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!