當我們說到p-value時,我們在說什麼?
“這個變量的p-value小于0.05,所以這個變量很重要”
........
你真的知道自己在說什麼麼???這個p-value到底是個什麼鬼?為什麼小于0.05就很重要?很重要是什麼意思?????
終于...
這次,我們通俗易懂地來講講到底什麼是p-value(p值)。
在講p-value之前,我們用擲硬币來舉個例子。
硬币有正反兩面,在概率中我們知道,出現正反面的概率各為50%(1/2),所以作為一個正常的硬币,如果我們投無限次後,結果一定會是正反各占50%。但是,如果我想知道自己手中的硬币,到底是不是正常的硬币,有沒有做過手腳,在實際操作中是沒辦法投擲無限次的。因此,我們隻能用有限的結果來判斷“硬币是否為常規硬币”這個問題的答案。
在統計學上,做這個檢驗時,通常會設定一個虛無假設(也叫零假設,Null Hypothesis),通常記作H0。以及一個對立假設(Alternative Hypothesis),及與虛無假設對立的假設,如果證明虛無假設錯誤,則可以推出對立假設成立。
在擲硬币這個例子中,我們可以設定
H0: 手中的硬币是常規硬币
H1: 手中的硬币做過手腳
如果手中硬币是常規硬币,我們知道正面和反面出現的概率各為50%,所以如果我投擲10次硬币,則正面和反面出現的次數各位5次。正面5次,反面5次,就是我們對于投擲10次硬币的期望值(expected value)。
現在我們開始投擲硬币,出現的是正面3次,反面7次。這個結果就是我們對于投擲10次硬币的觀測值(observed valued),即實際的結果。
通過分析期望值和觀測值的差距,我們就可以判斷出硬币是否正常。而這個期望值和觀測值差距的判斷方法就是chi-square。
Figure 1 chi-square計算公式
上圖即為chi-square的計算公式,O代表觀測值(observed value),E代表期望值(expected value)。有沒有覺得這和方差的公式很像?沒錯,其實方差是一組數據與其均值的比較,而chi-suaqre是一組數據與另一組數據期望值的比較。
那麼在擲硬币這個例子中chi-square(卡方)=(3-5)^2/5 (7-5)^2/5=1.6
Figure 2 擲硬币實驗:觀測值與期望值對比表
算出了chi-square,那麼又怎判斷檢驗結果呢?現在,跟我一起把卡方分布表(見Figure 2)拿出來~
Figure 3 卡方分布表
上圖即為卡方分布表,左上角的α表示錯誤拒絕H0假設的概率(即虛無假設事實上成立,但我們計算出的結果卻錯誤判斷虛無假設不成立的概率)。n代表自由度(degree of freedom),即獨立變量數減1,在這個例子中,獨立變量數為2(正面和反面),所以自由度為1(2-1=1)。
當然,你也會見到與上圖不一樣的卡方分布圖,比如Figure 3。P代表α,即P(當H0為真時拒絕H0)(其實就是p-value),df代表自由度(degree of freedom)。
Figure 4 卡方分布表
假設置信度為95%,即錯誤拒絕H0的概率為0.05。展開解釋就是,我們有95%的概率确信檢驗結果正确,有5%的概率會錯誤拒絕虛無假設。(我們總說的p值與0.05比較就是這個啦,其實不一定是0.05,根據具體情況可以設置不一樣的值,隻是大部分時候都用0.05)
對照着卡方分布表(Figure 4),找到1所在的行(我們計算出的chi-square自由度是1),發現1.6是介于1.323和2.706之間,查表得出其p值為0.25到0.1之間,大于0.05,所以我們不能拒絕H0。換句話說,H0成立,即硬币是常規硬币,沒有做手腳。
Figure 5 卡方分布表(chi-square=1.6)
大家通過觀察卡方分布表能夠發現,在用一個自由度下,chi-square越大,其p值就越小。舉個極端的例子,如果在擲硬币的例子中,我投擲10次硬币,剛好5次正面,5次反面,則此時算是的chi-square為0(觀測值與期望值一緻),這時的p-value是遠大于0.095,沒有理由拒絕H0,H0假設成立,即硬币是常規硬币。
Figure 6 卡方分布表(chi-square=0)
總結一下,
p-value的作用:p-value就是用來判斷H0假設是否成立的依據。因為期望值是基于H0假設得出的,如果觀測值與期望值越一緻,則說明檢驗現象與零假設越接近,則越沒有理由拒絕零假設。如果觀測值與期望值越偏離,說明零假設越站不住腳,則越有理由拒絕零假設,從而推出對立假設的成立。
p-value的計算:計算chi-suqare,計算自由度,查卡方分布表。
總的思路是,
做出H0,H1這對互斥的假設,計算出H0為真時的期望值,統計出實際的觀測值,通過期望值和觀測值求得chi-square(卡方),再通過卡方查表,得到p值。根據p值與α(1-置信度)的比較,如果p-value<α,則拒絕(reject)H0,推出H1成立;如果p-value>α,則接受(accpet)H0,推出H1不成立。
最後再劃重點,把開頭的幾個問題再解釋下。
【這個p-value到底是個什麼鬼?】p值可通過計算chi-square後查詢卡方分布表得出,用于判斷H0假設是否成立的依據。
【為什麼小于0.05就很重要?】大部分時候,我們假設錯誤拒絕H0的概率為0.05,所以如果p值小于0.05,說明錯誤拒絕H0的概率很低,則我們有理由相信H0本身就是錯誤的,而非檢驗錯誤導緻。大部分時候p-value用于檢驗獨立變量與輸入變量的關系,H0假設通常為假設兩者沒有關系,所以若p值小于0.05,則可以推翻H0(兩者沒有關系),推出H1(兩者有關系)。
【很重要是什麼意思?】當p值小于0.05時,我們就說這個獨立變量重要(significant),因為這個獨立變量與輸出結果有關系。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!