今天給大家寫寫如何用R軟件計算t檢驗中統計效能和樣本量。
實例描述現在有一個公司聲稱他們的燈泡一般能用850±50個小時,但是我買了一個發現用了700個小時就壞了,那我就懷疑了,商家虛假宣傳,那麼我該如何證明呢?或者說,我要測試多少個燈泡能證明商家撒謊?
在這個例子中我們的目的就是要弄明白我們到底需要測試多少個燈泡,似乎就是一個算樣本量的問題,在一個我們提前設定的顯著性水平和想要的統計效能下算出這個樣本量。
這麼樣思考好像挺難的,我們不妨先反過來想:
商家不是說他的燈泡能用850±50個小時嘛,而我堅信商家在撒謊,我認為商家多說了比如說40個小時,那麼此時我們就有
這時我們會進行一個統計檢驗,顯著性水平大多數情況會設定在0.05,意思是一類錯誤的概率是0.05,就是說當H0為真的時候我們隻有0.05的可能性拒絕它,就是說我們這個統計檢驗做出來燈泡确實用不到850小時,95%的情況下我們都是可靠的,這個叫做significance level;
那麼要做這個檢驗我們還要規定一個東西叫做統計效能power,通常設置為0.9,就是說我希望我做這個統計,如果燈泡真的用不到850小時,90%的情況下我能夠拒絕H0。
以上兩點,我們首先确定檢驗的可靠性,再次确定這個檢驗值得做确實有效力,想的都挺美,隻要我做了檢驗,如果燈泡真的用不到850小時,90%的情況下我都能夠拒絕H0得到陽性結果,而且呀,我得到陽性結果,假陽性的概率隻有0.05。
别急,标準差在整個過程中也有重要影響,我們想象一個極端的例子,比如如果燈泡使用壽命沒有變異,就是商家說能用850小時,那麼每個燈泡都應該能用850小時,此時,隻要一個燈泡就能解決我們的懷疑,但是現實總是不确定的,有的能1000小時,有的能用500小時,我們隻能多取點樣本以期覆蓋更多的變異,所以變異常常也會影響我們做統計時的樣本量,這就扯出來了我們要讨論的另一個東西,叫做效應量(下一部分會寫它如何來的)。
實際上,,以及效應量這四個指标,知道了任意三個,就可以推導出最後一個。通常,是已知的(由研究者确定,一般為0.05)。
用R語言計算統計效能在R語言中,對于均值檢驗的統計功效和樣本量計算是非常容易的,我們隻用規定另外3個值就行,比如我要計算效應量d為(850-810)/50,統計功效為0.9,顯著性水平是0.05時的樣本量,寫如下代碼就可以:
library(pwr)
pwr.t.test(d=(850-810)/50,power=0.9,sig.level=0.05,type="one.sample",alternative="two.sided")
結果就很明确了,我們隻需要測試19個燈泡就可以在90%的情況下拒絕H0(如果燈泡真的用不到850小時的話)。
上面是從确定統計效能為0.9,顯著性水平為0.05時求樣本量。
我們還可以确定樣本量和顯著性水平後求統計效能:
pwr.t.test(d=(850-810)/50,n=10,sig.level=0.05,type="one.sample",alternative="two.sided")
從結果看,我們将樣本量設置為10的話,求得的統計效能就是0.616,也就是說,如果商家的燈泡真的用不到850小時,我隻用10個樣本來檢驗的話,有差不多40%的可能性是檢驗不出來的。
還有我們其實也可以很自然的推測出,要實現相同的統計效能,如果變異小,那麼需要的樣本量也就小(你可以想象剛剛的極端例子),我們可以驗證一下:
pwr.t.test(d=(850-810)/50,power=0.8,sig.level=0.05,type="one.sample",alternative="two.sided")
pwr.t.test(d=(850-810)/30,power=0.8,sig.level=0.05,type="one.sample",alternative="two.sided")
上面的代碼一個标準差是50,另一個是30,我們要實現0.8的統計效能,得到的樣本量一個是14,一個是6.5,基本上我們的推測得到了驗證。
這兒再提一句,對于我們例子中的t檢驗,我們感興趣是兩個樣本均值之間的差異,而非單個個體之間的差異,而對于兩個樣本之間差異大小真正起作用的就是均值和标準差的比。
這個比就能夠很好地描述兩樣本之間的差異,這個就叫做效應量:effect size
你可以看,下面的代碼因為效應量其實是一樣的,所以最後得到的我們需要的樣本量都是18.4
pwr.t.test(d=(50-10)/50,power=0.9,sig.level=0.05,type="one.sample",alternative="two.sided")
pwr.t.test(d=(1-.2),power=0.9,sig.level=0.05,type="one.sample",alternative="two.sided")
很多時候我們這個效應量并不是很好得到,所以經常會有很多人問我,顯著性水平,統計效能都可以默認,那麼我計算樣本量時研究中的效應量設多少啊?這個就得去查文獻或者做預試驗了。
小結今天給大家寫了t檢驗中樣本量和統計效能的計算,前面應該還有些鋪墊的,不過我感覺别的作者已經寫的非常清晰了,大家可以參考AhaDad的文章:
假設檢驗基礎:α錯誤,β錯誤,樣本容量,效應量的關系簡介
感謝大家耐心看完,自己的文章都寫的很細,代碼都在原文中,希望大家都可以自己做一做,也歡迎大家的意見和建議。
如果你是一個大學本科生或研究生,如果你正在因為你的統計作業、數據分析、論文、報告、考試等發愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何問題,都可以聯系我。因為我可以給您提供最好的,最詳細和耐心的數據分析服務。
如果你對Z檢驗,t檢驗,方差分析,多元方差分析,回歸,卡方檢驗,相關,多水平模型,結構方程模型,中介調節等等統計技巧有任何問題,請私信我,獲取最詳細和耐心的指導。
If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.
Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??
Then Contact Me. I will solve your Problem...
加油吧,打工人!
往期内容:R數據分析:如何計算問卷的聚合效度,實例操練
R數據分析:如何計算問卷的組合信度,實例操練
R數據分析:中介效應的做法
R數據分析:混合效應模型實例
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!