tft每日頭條

 > 生活

 > 樣本量對假設檢驗有無影響

樣本量對假設檢驗有無影響

生活 更新时间:2025-02-08 05:14:42
閱讀提示

本文針對剛剛接觸零假設顯著性檢驗的同學,最好已經了解:

  • 假設檢驗
  • 抽樣分布
  • 正态分布
  • 标準分數
做研究的基本套路

随機變量服從均值為,标準差為的正态分布,即。

現在對施加某種處理,使的值發生了變化,變成。我們假設這種處理的效果是恒定的,即。那麼,隻是均值發生了變化,而方差不變,分布的形态也不變。,其中

做心理學實驗,基本上就是這個套路:對施加處理得到。然後比較一下與的均值有沒有變化,以此來判斷處理是否有效果,效果如何。

當然直接比較和是不可能的,因為這兩個都是總體參數,基本上是不可能直接獲取的。我們能夠得到的隻是和的一個樣本,需要通過樣本來推斷總體參數。

為了便于講解,我們假設未知的隻是

現在我們就需要從中抽取一個樣本量為的樣本,該樣本均值用表示。因為樣本容量為的樣本可以抽取非常多,理論上是無限個,于是可以得到非常多的。

也就是說,也是一個随機變量,此時的分布叫做樣本均值的抽樣分布,其分布的均值與的相同,均為,标準差為,形态依然是正态分布。此時抽樣分布的标準差也稱為标準誤,因為其體現了抽樣誤差的大小。

零假設和備擇假設

進行假設檢驗的第一步,就是提出假設。

我們的研究總是期待處理是有效果的:才是我們所希望的結果。

不過,進行假設檢驗所采用的邏輯是反證法,通常是從反面出發進行推導。所以,我們通常先假設,這就是假設檢驗中的零假設

與零假設互不相容的,就是研究者所希望的結果,即,稱為備擇假設

不同假設下抽樣分布的形态,以及兩種錯誤

當成立時,,的抽樣分布為。

當成立時,,的抽樣分布為。

可見,兩個假設下,的抽樣分布僅僅是均值發生了變化,從圖像上來看,二者相當于是平移了的距離。

當然,的取值是未知的,這個值實際上體現了效應量的大小,也是需要估計的。

圖像如下:

樣本量對假設檢驗有無影響(假設檢驗基礎α錯誤)1

由于進行假設檢驗都是從出發,設定的顯著性水平是在紅色的分布中體現。

樣本量對假設檢驗有無影響(假設檢驗基礎α錯誤)2

此時橘色縱線就是臨界值,它的位置由決定,并将圖像分成了兩部分:右邊是拒絕域。如果得到的樣本均值位于該區域,那麼做出的決斷就是拒絕。左邊是接受域,如果得到的樣本均值位于臨界值的左邊,則接受(準去來說應該是“不能拒絕 ”)。

不論在臨界值的左邊還是右邊,都包含了紅色和藍色的兩個分布。

  • 臨界值右邊,紅色的分布對應區域表示:在成立時拒絕了,說明做出了錯誤的決斷,此時犯錯的概率就是顯著性水平。此時的錯誤也叫做Ⅰ型錯誤或者錯誤
  • 臨界值左邊,藍色的分布對應區域表示:在成立時(不成立),接受了。說明做出了錯誤的決斷,此時犯錯的概率為,也稱為Ⅱ型錯誤或者錯誤。如下圖:

樣本量對假設檢驗有無影響(假設檢驗基礎α錯誤)3

  • 臨界值左邊,紅色的分布對應的區域表示:在成立時,接受了。此時做出了正确的決斷。概率為。如下圖:

樣本量對假設檢驗有無影響(假設檢驗基礎α錯誤)4

  • 臨界值右邊,藍色的分布對應的區域表示:在成立時(不成立),拒絕了,說明做出了正确的決斷,此時的概率用表示,也稱為統計檢驗力。表示了在 成立時,正确得到顯著結果的概率。如下圖:

樣本量對假設檢驗有無影響(假設檢驗基礎α錯誤)5

在研究中,我們都是希望樣本均值掉落在臨界值右邊,為了避免在這種情況下犯錯,所以通常對進行限制。

從圖中可以看到,和并不是屬于同一個分布的,所以二者之和并不是1。

此外,在其他條件不變的情況下,如果變小,臨界值往右移動,那麼随之變大。反之,變大,就變小

可以在研究前設定,那麼怎麼計算呢?

研究中通常設定了的大小,那麼就不管了嗎?

當然不是,也是一個非常重要的指标,因為它決定了統計檢驗力的大小。

讓我們先來,看看,如果要計算,還需要什麼?

如下圖:

樣本量對假設檢驗有無影響(假設檢驗基礎α錯誤)6

既然已經知道了,那麼便可以得到臨界值到的距離,。

從而求出

在藍色的分布中,體現了臨界值到的距離,将其轉換為标準分數:

知道了之後,便可以輕松的求出了

可知,受到3個因素的影響:

  • 決定了臨界值的位置,所以肯定會影響
  • 兩個分布的标準距離,影響了兩個分布的偏離程度,從而影響了。這個标準距離就是我們熟知的效應量
  • 樣本的大小,影響了抽樣分布的标準差,從而影響了分布的形狀(高狹,低矮),進一步影響了。

實際上,,以及效應量這四個指标,知道了任意三個,就可以推導出最後一個。通常,是已知的(由研究者确定,一般為0.05)。

在研究開始之前,通常需要确定樣本量。此時可以通過查閱文獻,合理的假設效應量大小。并且進一步規定本次研究的檢驗力,确定。據此推算出本次研究需要的。

在研究結束之後,通常需要估計的檢驗力的大小。此時已知,可以利用樣本均值來估計,樣本标準差來估計(如果已知就不用估計了),從而估計效應量的大小。進一步可以計算出檢驗力。

當然,上面的講解使用的是最簡單的檢驗,通常實際研究中很少用到。但計算的原理與檢驗等是一緻的,隻是分布圖不同而已。

分布圖比正态分布要複雜,通常也不會手算效應量,可以利用G*Power很方便的計算。

小結
  • 和位于不同的分布中(前提不同),二者并不是互補的關系。
  • 和效應量可以互相推導,知道了任意三個可以推導另一個。
  • 可以利用G*Power方便的計算上述指标。

感謝大家耐心看完,也歡迎大家的意見和建議。

如果你是一個大學本科生或研究生,如果你正在因為你的統計作業、數據分析、論文、報告、考試等發愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何問題,都可以聯系我。因為我可以給您提供最好的,最詳細和耐心的數據分析服務。

如果你對Z檢驗,t檢驗,方差分析,多元方差分析,回歸,卡方檢驗,相關,多水平模型,結構方程模型,中介調節等等統計技巧有任何問題,請私信我,獲取最詳細和耐心的指導。

If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.

Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??

Then Contact Me. I will solve your Problem...

加油吧,打工人!

本文轉載自AhaDad,請支持原創!

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved