本文針對剛剛接觸零假設顯著性檢驗的同學,最好已經了解:
随機變量服從均值為,标準差為的正态分布,即。
現在對施加某種處理,使的值發生了變化,變成。我們假設這種處理的效果是恒定的,即。那麼,隻是均值發生了變化,而方差不變,分布的形态也不變。,其中
做心理學實驗,基本上就是這個套路:對施加處理得到。然後比較一下與的均值有沒有變化,以此來判斷處理是否有效果,效果如何。
當然直接比較和是不可能的,因為這兩個都是總體參數,基本上是不可能直接獲取的。我們能夠得到的隻是和的一個樣本,需要通過樣本來推斷總體參數。
為了便于講解,我們假設未知的隻是
現在我們就需要從中抽取一個樣本量為的樣本,該樣本均值用表示。因為樣本容量為的樣本可以抽取非常多,理論上是無限個,于是可以得到非常多的。
也就是說,也是一個随機變量,此時的分布叫做樣本均值的抽樣分布,其分布的均值與的相同,均為,标準差為,形态依然是正态分布。此時抽樣分布的标準差也稱為标準誤,因為其體現了抽樣誤差的大小。
零假設和備擇假設進行假設檢驗的第一步,就是提出假設。
我們的研究總是期待處理是有效果的:才是我們所希望的結果。
不過,進行假設檢驗所采用的邏輯是反證法,通常是從反面出發進行推導。所以,我們通常先假設,這就是假設檢驗中的零假設。
與零假設互不相容的,就是研究者所希望的結果,即,稱為備擇假設。
不同假設下抽樣分布的形态,以及兩種錯誤當成立時,,的抽樣分布為。
當成立時,,的抽樣分布為。
可見,兩個假設下,的抽樣分布僅僅是均值發生了變化,從圖像上來看,二者相當于是平移了的距離。
當然,的取值是未知的,這個值實際上體現了效應量的大小,也是需要估計的。
圖像如下:
由于進行假設檢驗都是從出發,設定的顯著性水平是在紅色的分布中體現。
此時橘色縱線就是臨界值,它的位置由決定,并将圖像分成了兩部分:右邊是拒絕域。如果得到的樣本均值位于該區域,那麼做出的決斷就是拒絕。左邊是接受域,如果得到的樣本均值位于臨界值的左邊,則接受(準去來說應該是“不能拒絕 ”)。
不論在臨界值的左邊還是右邊,都包含了紅色和藍色的兩個分布。
在研究中,我們都是希望樣本均值掉落在臨界值右邊,為了避免在這種情況下犯錯,所以通常對進行限制。
從圖中可以看到,和并不是屬于同一個分布的,所以二者之和并不是1。
此外,在其他條件不變的情況下,如果變小,臨界值往右移動,那麼随之變大。反之,變大,就變小
可以在研究前設定,那麼怎麼計算呢?研究中通常設定了的大小,那麼就不管了嗎?
當然不是,也是一個非常重要的指标,因為它決定了統計檢驗力的大小。
讓我們先來,看看,如果要計算,還需要什麼?
如下圖:
既然已經知道了,那麼便可以得到臨界值到的距離,。
從而求出
在藍色的分布中,體現了臨界值到的距離,将其轉換為标準分數:
知道了之後,便可以輕松的求出了
可知,受到3個因素的影響:
實際上,,以及效應量這四個指标,知道了任意三個,就可以推導出最後一個。通常,是已知的(由研究者确定,一般為0.05)。
在研究開始之前,通常需要确定樣本量。此時可以通過查閱文獻,合理的假設效應量大小。并且進一步規定本次研究的檢驗力,确定。據此推算出本次研究需要的。
在研究結束之後,通常需要估計的檢驗力的大小。此時已知,可以利用樣本均值來估計,樣本标準差來估計(如果已知就不用估計了),從而估計效應量的大小。進一步可以計算出檢驗力。
當然,上面的講解使用的是最簡單的檢驗,通常實際研究中很少用到。但計算的原理與檢驗等是一緻的,隻是分布圖不同而已。
分布圖比正态分布要複雜,通常也不會手算效應量,可以利用G*Power很方便的計算。
小結感謝大家耐心看完,也歡迎大家的意見和建議。
如果你是一個大學本科生或研究生,如果你正在因為你的統計作業、數據分析、論文、報告、考試等發愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何問題,都可以聯系我。因為我可以給您提供最好的,最詳細和耐心的數據分析服務。
如果你對Z檢驗,t檢驗,方差分析,多元方差分析,回歸,卡方檢驗,相關,多水平模型,結構方程模型,中介調節等等統計技巧有任何問題,請私信我,獲取最詳細和耐心的指導。
If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.
Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??
Then Contact Me. I will solve your Problem...
加油吧,打工人!
本文轉載自AhaDad,請支持原創!
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!