快要臨近春節了,但持續一年之久的疫情還在繼續,不知是否會影響到今年的春節回家之路。今天故以杜甫的思鄉詩開頭。
月夜憶舍弟
唐 杜甫
戍鼓斷人行,邊秋一雁聲。
露從今夜白,月是故鄉明。
有弟皆分散,無家問死生。
寄書長不達,況乃未休兵。
這首詩杜甫寫在安史之亂年間,當時各地處于戰亂之中,杜甫的幾個兄弟處于戰亂地區,音信不通,觸發了杜甫的憂慮和思念,該首詩表達了杜甫對兄弟的思念之情。
非參數檢驗簡介在前面章節中談到的檢驗多為參數檢驗,需要符合一定的條件,如獨立性、正态性、方差齊性等。若資料在理論上不滿足相應條件,則使用上述方法會有一定的誤差;如何得到正确的檢驗結果呢?那就是非參數檢驗。
非參數檢驗(nonparametric test)是相對于參數檢驗而言的。如果總體分布為已知的數學形式,對總體參數做假設檢驗稱為參數檢驗。
非參數檢驗直接對總體分布做假設檢驗而不事先指定其分布形式,也可稱為任意分布檢驗(distribution-free test)。其方法較多,常用基于秩轉換的非參數檢驗,即秩和檢驗。秩和檢驗是先将數值變量資料從小到大,或登記資料按其高低轉換成秩後,再計算秩檢驗統計量。其特點是假設檢驗的結果對總體分布的性質差别不敏感。
相對于參數檢驗而言,非參數檢驗适用範圍更廣,适用計量、等級和計數資料的統計分析;并且,非參數檢驗不需要知道原始數據的數值大小,僅需要知道各分類數據的頻次就可以進行檢驗。其應用範圍包括:
非參數卡方主要用于分析單組計數資料是否符合特定的分布。
示例1:某高校随機抽取600名學生,想知道性别(男生和女生)是否符合1:1分布?或者是否符合0.4:0.6分布?
1. 數據錄入:
2. 建立假設:建立檢驗假設,确定檢驗水準 α
3. 參數選擇
(1) 選擇 分析—非參數檢驗—舊對話框—卡方
(2) 參數說明與選擇
a. 檢驗變量列表:用于從變量列表中選擇 檢驗變量,必須為數值型分類變量;若選擇多個變量,将淡入進行分析。
b. 期望範圍:設置檢驗變量取值的區間範圍,有兩種可選方式:
c. 期望值:設置待檢驗理論期望值的具體取值,有兩種可選方式:
4. 數據結果與說明
(1)數據基本描述:顯示實際樣本數和期望樣本數(本例各類别比例相等,即為599/2=299.5)
(2)檢驗結果
5. 語法:
***************** 卡方檢驗 *******************.
NPAR TESTS
/CHISQUARE=性别
/EXPECTED=EQUAL
/STATISTICS DESCRIPTIVES
/MISSING ANALYSIS.
示例2:示例1中我們選擇的是“所有類别都相等”,如果我們要指定特定的分布男:女=0.6:0.4,那參數設置和檢驗結果如何呢?
1. 建立假設:建立檢驗假設,确定檢驗水準 α
2. 參數選擇
---- 因為男性 值為1,女性為 2,所以在 值 右邊的輸入框中 輸入 0.6,點擊添加;然後再輸入 0.4,點擊添加
3. 數據結果與說明
(1) 數據基本描述:顯示實際樣本數與期望樣本數
(2) 檢驗結果
4. 語法:
***************** 卡方檢驗 *******************.
NPAR TESTS
/CHISQUARE=性别
/EXPECTED=0.6 0.4
/STATISTICS DESCRIPTIVES
/MISSING ANALYSIS.
前面我們看到的數據都是有相應的樣本的數據;在具體分析時,也可用各類别的頻數數據,如以下示例所示:
示例3:在測試數據中,男生-310人,女生-289人,那男生、女生比例分布是屬于均勻分布?
1. 建立假設:建立檢驗假設,确定檢驗水準 α
2. 參數選擇
(1) 數據加權
(2) 選擇 分析—非參數檢驗—舊對話框—卡方
(3) 參數說明與選擇
3. 數據結果與說明
(1) 數據基本描述:顯示實際樣本數和期望樣本數(本例各類别比例相等,即為599/2=299.5)
(2) 檢驗結果
4. 語法
****************** 加權 **************.
WEIGHT BY count.
****************** 卡方檢驗 **************.
NPAR TESTS
/CHISQUARE=gender
/EXPECTED=EQUAL
/MISSING ANALYSIS.
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!