在統計學問題中,我們經常會見到P值或者P-value,比如回歸分析中,通過P值來判斷回歸變量的合理性。
翻開統計學書籍,會得到一個解釋:P值就是原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。
這句話其實很容易理解,但是,初學者看到這句話,一臉懵逼,感覺說了跟沒說一樣。
對于假設檢驗來說,一般我們根據計算出來的z值和臨界值進行比較,來決定是否拒絕原假設。
如下圖所示,如果落在兩側的拒絕域,就拒絕原假設,反之,則接受原假設。
但是,在實際應用中,我們往往是根據P值來檢驗統計量。
那麼,這個P值是什麼意思?
假設顯著性水平是0.05,也就是,那麼兩側的面積,相當于概率,其實就是0.05。
如果,此時計算出來的z值落在了下圖中左側藍色這個小區域内,圖中紅色标記。
那麼,這個z值對應的概率,也就是紅線左側曲線下方的面積可以計算出來。
舉個例子,z值計算出來為:-2.5,則可以計算出對應的概率為:0.00621。
用Excel公式就可以計算出來,公式如下。
計算出來之後,再乘以2,即
0.00621×2=0.01242,因為兩邊都有,對稱的(假設是雙側檢驗)。
計算出來的這個概率值就叫作P值(P-value)。
如果這個值很小,也就是小于0.05,那麼,說明原假設代表的這個事件是一個小概率事件,不會發生。所以,就拒絕原假設。
再來看本文開頭的解釋:P值就是原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。
P值其實就是原假設所代表的這個事件出現的概率,如果小于規定的顯著性水平,則拒絕原假設。
以上就是假設檢驗中的P值。
如果想系統學習數據分析,請查看以下專欄。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!