tft每日頭條

 > 圖文

 > 假設檢驗的p值

假設檢驗的p值

圖文 更新时间:2025-01-24 11:33:56

關于單樣本和兩獨立樣本T檢驗的操作方法,我們今天先不談具體的步驟,而是通過案例全方位地将T檢驗和P值的邏輯和思想,掰開揉碎,嘗試用白話再梳理一遍,增進大家的理解,不足之處,歡迎指出讨論。

假設檢驗的p值(T檢驗和其他假設檢驗的P值怎麼理解)1

案例:5年前,全國男性的平均身高是1.75米(普查得到的總體均值),現在我們想知道如今男性的平均身高是否發生了改變。

思路:從全國男性群體中随機抽取1000名樣本,獲得樣本均值和樣本标準差,進行假設檢驗。

此處需要提醒的是,在進行假設檢驗時,我們的關注點在樣本均值上,即我們不太關注原始樣本的情況,而是關注由這個樣本計算的樣本均值了。

現在,在腦海中重複上面的操作:比如我們随機抽取100次,每次都抽取1000名,所以,我們會得到100個樣本均數,将這100個樣本均數放在一起再求均數和标準差,得到的均數會更加接近全國這個總體的均數,而這個标準差就是你聽過的“标準誤”。

然而,現實情況中我們隻會抽取一次,隻會得到一個樣本均數和一個樣本标準差,雖然這一個樣本均數不如上面由100個樣本均數平均後計算地精确,但在數學上仍可以證明,這一個樣本均數也可以用來很好地估計總體均數。所以,問題的關鍵就變成了,不抽取100次,怎麼計算“标準誤”?好在我們也能證明,隻抽樣一次獲得的樣本标準差(S),除以根号N就可以得到“标準誤”的估計值了,于是抽樣一次就可以簡單算出“标準誤”,再次提醒,這個“标準誤”實際上就是均數的标準差。

現在我們正式開始T檢驗的思路。上文提到了,我們關注的随機變量已經不是原始的身高了,而是身高的均數,身高的均數,身高的均數(重要的話,講三遍)。所以,身高均數成為了我們研究的随機變量,它也存在總體與樣本的區分,它也有均值和标準差,而且我們還可以确定無論身高是否真正服從正态分布,身高均值這個變量總是近似服從正态分布(中心極限定理),由此我們就可以利用這些性質進行假設檢驗。

回到上面的問題,5年前全國男子身高的總體均值是1.75米(μ),我們想知道現在是否有變化,其實就是想檢驗,5年後的現在全國男子身高的總體均值是否還是1.75米。因為我們不進行普查,所以我們希望通過随機抽取一個1000人的樣本來進行推斷和檢驗。得到樣本後,我們可以計算出樣本均數、樣本标準差以及标準誤。

假設樣本均數為 1.77,顯然我們不能因為1.77和1.75這兩個數字的不同就判斷說現在全國男子的平均身高要大于5年前了。因為即使現在的身高沒有變化,你随機抽取一個1000人的樣本得到的樣本均數也不可能就恰好等于1.75,這很好理解,抽樣是有誤差的。于是,我們就要搞清楚現在得到的這個樣本均數(1.77)和5年前的總體均數(1.75)的差異僅僅是因為抽樣誤差,還是确實是因為現在人們的平均身高發生了變化,這裡的“變化”用數學的語言表達就是:現在全國男子身高的總體均數到底還是不是1.75,注意這裡是“總體均數”,也就是說我們真正關心的是總體,樣本隻是用來獲得總體信息的一個手段。

我們先假設,現在的總體均數沒有變,仍等于1.75。所以,我們抽取的1000人就認為是在這個總體中抽取的一個樣本。在零假設情況下,這個總體的均數是1.75,而我們獲得的樣本計算出來的樣本均數是1.77,假設檢驗的問題就轉換成了:在一個總體均數為1.75的總體中,抽到如今這個樣本的概率是多少?

很明顯,如果這樣問,答案肯定就是0。在先前的文章中,我們知道一個樣本相當于數軸上的一個點,而從一個數軸中抽取一個點的概率就是0。然後,你就看到了那句“永遠讓人費解的話”:P值是抽取到現有樣本或更極端情況樣本的概率。

如果把樣本割裂來看,抽到一個樣本的概率就是0,而“現有樣本或更極端情況的樣本”中的“或”字表明,P不是指的一個點的概率,而是一個區間的概率,也就是在μ為1.75的總體中,根據抽到的樣本計算的樣本均值比1.77還要大的樣本(比如1.78或1.80),這些樣本合起來的概率就是P,而這些樣本相對均數為1.75的總體而言便是“更極端樣本”了。看到這裡,你可以想想這句話怎麼用概率式子表示出來呢?

最後一個問題就是,如何計算P值?這裡需要的基礎知識是:知道一個變量服從正态分布,怎麼計算這個變量在某個區間上的概率。比如,随機變量X服從均值為2.5,标準差為1.6的正态分布,如何求X<4的概率。這種問題的解法應該都學過,我們簡單回顧一下。首先将X進行标準化處理(即将變量減去均數然後除以标準差),比如将4标準化:(4-2.5)/1.6=0.94,然後查标準正态概率分布表P(Z≤0.94)=0.8264,于是就得到P(X<4)=0.94。

以下内容,涉及公式的編輯,為保清晰,所以采取截圖的形式發布

假設檢驗的p值(T檢驗和其他假設檢驗的P值怎麼理解)2


我們是誰?

我們是由畢業于北京大學的丁小丁和丁小點共同創立的,旨在搭建一個知識分享和一對一咨詢平台——丁點幫你。

希望通過我們的努力,給大家分享有價值的觀點和知識,同時讓您的問題得到及時的、有針對性的回答。歡迎掃描下方二維碼關注我們的微信公衆号“丁點幫你”。

歡迎交流,歡迎投稿!

假設檢驗的p值(T檢驗和其他假設檢驗的P值怎麼理解)3

"丁點幫你"微信公衆号

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved