假設檢驗是由統計學家費舍爾提出的。當時費舍爾在劍橋大學任職,英國最出名的是什麼?下午茶。他們一群專家學者每周二也會聚在一起喝下午茶。有一次下午茶的時候,來了一位女士,這位女士告訴他們:一杯茶,即使茶和奶的比例相同,先加茶後加奶與先加奶後加茶味道是完全不一樣的。那這群科學家肯定不信啊,相同的配方,隻是先後順序不同,味道還能不一樣了?要是普通人可能說下次去試試也就過去了,但是他們是科學家啊,要大膽假設小心驗證。首先假設這位女士沒有能力區分茶奶與奶茶。然後他們泡了一杯茶,讓這位女士分辨它是先加了茶還是先加了奶。結果這位女士說對了,但是就一次,即使盲猜也有50%的概率猜對,所以他們重複進行了8次實驗,這位女士都說對了。而如果靠猜全部猜對的概率隻有0.5^8,這個概率很小,當小概率時間發生的時候,我們更傾向于認為原假設是錯誤的。假設檢驗的基本思想就是小概率事件不會發生。
在現實世界,小概率事件有可能發生,隻是發生的概率較小,假設檢驗隻是在統計學意義上判斷假設是否成立。
假設檢驗總體來說分為兩步,第一步:對總體參數進行假設;第二步:利用抽樣數據判斷這個假設是否成立。
具體實施,需要5 步:
第一步,建立需要檢驗的假設,一般來說,被檢驗的假設稱為原假設,記為H0;原假設的反命題被稱為備擇假設,記為Ha。
建立假設時,我們一般習慣于将我們想要得到的結論放在備擇假設中。還有一個習慣,就是将等号放在原假設中。
假設檢驗分為雙尾檢驗和單尾檢驗,判斷是雙尾檢驗還是單位檢驗隻需要看備擇假設即可:
如果備擇假設是不等号,就是雙尾檢驗;,如果備擇假設是大于或小于号就是單尾檢驗,大于号時是右尾,小于号就是左尾。雙尾還是單尾在形成拒絕域的時候至關重要,但是對檢驗統計量并沒有什麼影響。
假設我們現在調查全國人民的平均身高是否為170cm,
首先我們建立需要檢驗的假設,原假設就是全國人民的平均身高=170cm,備擇假設就是全國人民的平均身高不等于170cm。
因為備擇假設是不等号,所以他是雙尾檢驗。
第二步,選擇合适的檢驗統計量并确定它服從的概率分布,進行計算。
對于單個均值μ來說,它的樣本統計量就是X ̅,根據中心極限定理,
它的檢驗統計量需要分為兩種情況
繼續我們上面的例子,假設σ^2=400,n=100,X ̅=175cm那麼這裡的檢驗統計量就是
第三步,查表确定關鍵值。
關鍵值是判斷是否拒絕原假設的的臨界值,拒絕域是由原假設被拒絕的樣本觀測值所組成的區域。
關鍵值與拒絕域需要根據檢驗統計量的概率分布,顯著性水平α以及是單尾檢驗還是雙尾檢驗來确定。
概率分布的确定遵從
σ^2已知,z分布
σ^2未知,t分布
非正态小樣本不可估計
我們繼續上面我們的例子,σ^2已知,所以我們這裡用Z分布。
如果我們希望原假設成立,那麼抽樣調查計算出來的X-與170cm相比,既不能太低,也不能太高,所以對于雙尾檢驗來說,拒絕域在左右兩側尾部。
顯著性水平是5%,那麼拒絕域的總面積就是5%,也就是概率分布的左右尾部的概率分别為2.5%。如果檢驗統計量服從正态分布,那麼 查正态分布的累計概率分布表就可以确定關鍵值是1.96。
但是如果我們的原假設改為
那麼備擇假設就是
所以,它是單尾檢驗。也就是說如果我們希望原假設成立,那麼抽樣調查計算出來的樣本均值X-與170cm相比,不能比170cm高太多,所以它的拒絕域在右側尾部。顯著性水平是5%,因此,右側尾部的面積就是5%,查表我們可以知道,關鍵值就等于1.65。
第四步,比較檢驗統計量的絕對值與關鍵值的大小,如果檢驗統計量的絕對值大于關鍵值,說明檢驗統計量會落在拒絕域内,那麼就需要拒絕原假設。
第五步,下結論
這裡我們要注意,如果檢驗統計量沒有落在拒絕域内,我們不能說接受原假設,而隻能說不能拒絕原假設。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!