tft每日頭條

 > 科技

 > 卡方檢驗與非參數檢驗區别

卡方檢驗與非參數檢驗區别

科技 更新时间:2024-07-23 13:04:05
序曲

快要臨近春節了,但持續一年之久的疫情還在繼續,不知是否會影響到今年的春節回家之路。今天故以杜甫的思鄉詩開頭。

月夜憶舍弟

唐 杜甫

戍鼓斷人行,邊秋一雁聲。

露從今夜白,月是故鄉明。

有弟皆分散,無家問死生。

寄書長不達,況乃未休兵。

這首詩杜甫寫在安史之亂年間,當時各地處于戰亂之中,杜甫的幾個兄弟處于戰亂地區,音信不通,觸發了杜甫的憂慮和思念,該首詩表達了杜甫對兄弟的思念之情。

非參數檢驗簡介

在前面章節中談到的檢驗多為參數檢驗,需要符合一定的條件,如獨立性、正态性、方差齊性等。若資料在理論上不滿足相應條件,則使用上述方法會有一定的誤差;如何得到正确的檢驗結果呢?那就是非參數檢驗。

非參數檢驗(nonparametric test)是相對于參數檢驗而言的。如果總體分布為已知的數學形式,對總體參數做假設檢驗稱為參數檢驗。

非參數檢驗直接對總體分布做假設檢驗而不事先指定其分布形式,也可稱為任意分布檢驗(distribution-free test)。其方法較多,常用基于秩轉換的非參數檢驗,即秩和檢驗。秩和檢驗是先将數值變量資料從小到大,或登記資料按其高低轉換成秩後,再計算秩檢驗統計量。其特點是假設檢驗的結果對總體分布的性質差别不敏感。

相對于參數檢驗而言,非參數檢驗适用範圍更廣,适用計量、等級和計數資料的統計分析;并且,非參數檢驗不需要知道原始數據的數值大小,僅需要知道各分類數據的頻次就可以進行檢驗。其應用範圍包括:

  • 不滿足正态 方差齊性等條件的計量資料
  • 分布未知的計量資料
  • 等級資料
非參數卡方檢驗

非參數卡方主要用于分析單組計數資料是否符合特定的分布

示例1:某高校随機抽取600名學生,想知道性别(男生和女生)是否符合1:1分布?或者是否符合0.4:0.6分布?

1. 數據錄入:

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)1

2. 建立假設:建立檢驗假設,确定檢驗水準 α

  • H0:男生、女生符合1:1分布
  • H1:男生、女生不符合1:1分布
  • α = 0.05,即置信區間為95%

3. 參數選擇

(1) 選擇 分析—非參數檢驗—舊對話框—卡方

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)2

(2) 參數說明與選擇

a. 檢驗變量列表:用于從變量列表中選擇 檢驗變量,必須為數值型分類變量;若選擇多個變量,将淡入進行分析。

b. 期望範圍:設置檢驗變量取值的區間範圍,有兩種可選方式:

  • 從數據中獲取:表示檢驗變量每個唯一的取值作為一個類别,默認選項
  • 使用指引指定範圍:可自行設定特定的範圍,需要在上限、下限中分别指定檢驗變量的最大、最小值,超過該範圍樣本則忽略不計

c. 期望值:設置待檢驗理論期望值的具體取值,有兩種可選方式:

  • 所有類别相等:表示每個類别的期望取值都相等,即檢驗樣本是否為均勻分布,默認選項。本例選擇 所有類别相等
  • 值:自行設置特定的期望值,可在 右側輸入框 指定一個期望值,然後通過按鈕 添加更改删除 指定期望值的取值;特别注意:輸入的順序非常重要,每個新輸入的期望值自動顯示在期望值列表的底部,而列表中的期望值以從上到下的順序,對應樣本類别取值從小到大的順序

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)3

  • 統計:顯示 數據基本描述,及 缺失值的處理方法
  • 精确檢驗:當應用卡方檢驗的前提條件不滿足時,例如有多于20%的單元格期望頻數小于5時,可以在 精确檢驗 界面設置采用其他的檢驗方法,包括 Exact精确檢驗 和 蒙特卡洛方法。

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)4

4. 數據結果與說明

(1)數據基本描述:顯示實際樣本數和期望樣本數(本例各類别比例相等,即為599/2=299.5)

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)5

(2)檢驗結果

  • 從下表可知,本例的卡方=0.736,顯著性差異p=0.391>0.05,說明男性、女性分布符合均勻分布,即1:1分布

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)6

5. 語法:

***************** 卡方檢驗 *******************. NPAR TESTS /CHISQUARE=性别 /EXPECTED=EQUAL /STATISTICS DESCRIPTIVES /MISSING ANALYSIS.


示例2:示例1中我們選擇的是“所有類别都相等”,如果我們要指定特定的分布男:女=0.6:0.4,那參數設置和檢驗結果如何呢?

1. 建立假設:建立檢驗假設,确定檢驗水準 α

  • H0:男生、女生比例符合0.6:0.4分布
  • H1:男生、女生比例不符合0.6:0.4分布
  • α = 0.05,即置信區間為95%

2. 參數選擇

  • 主頁面:在檢驗變量列表中選擇 性别
  • 值:

---- 因為男性 值為1,女性為 2,所以在 值 右邊的輸入框中 輸入 0.6,點擊添加;然後再輸入 0.4,點擊添加

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)7

  • 其他選項 選擇默認

3. 數據結果與說明

(1) 數據基本描述:顯示實際樣本數與期望樣本數

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)8

(2) 檢驗結果

  • 從下表可知,本例的卡方=16.975,顯著性差異p=0.000 < 0.05,說明男性、女性分布不符合0.6:0.4比例分布。

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)9

4. 語法:

***************** 卡方檢驗 *******************. NPAR TESTS /CHISQUARE=性别 /EXPECTED=0.6 0.4 /STATISTICS DESCRIPTIVES /MISSING ANALYSIS.


前面我們看到的數據都是有相應的樣本的數據;在具體分析時,也可用各類别的頻數數據,如以下示例所示:

示例3:在測試數據中,男生-310人,女生-289人,那男生、女生比例分布是屬于均勻分布?

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)10

1. 建立假設:建立檢驗假設,确定檢驗水準 α

  • H0:男生、女生符合1:1分布
  • H1:男生、女生不符合1:1分布
  • α = 0.05,即置信區間為95%

2. 參數選擇

(1) 數據加權

  • 選擇 數據—個案加權,本例選擇 count加權

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)11

(2) 選擇 分析—非參數檢驗—舊對話框—卡方

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)12

(3) 參數說明與選擇

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)13

  • 檢驗變量列表:将 gender 選擇為檢驗變量列表。
  • 期望範圍--從數據中獲取:表示檢驗變量每個唯一取值作為一個類别,默認選項
  • 期望值:選擇 所有類别相等

3. 數據結果與說明

(1) 數據基本描述:顯示實際樣本數和期望樣本數(本例各類别比例相等,即為599/2=299.5)

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)14

(2) 檢驗結果

  • 從下表可知,本例的卡方=0.736,顯著性差異 p=0.391>0.05,說明男性、女性分布符合均勻分布,即1:1分布

卡方檢驗與非參數檢驗區别(非參數檢驗之非參數卡方檢驗)15

  • 從上表可看出,該結果同所有樣本數據相一緻。

4. 語法

****************** 加權 **************. WEIGHT BY count. ****************** 卡方檢驗 **************. NPAR TESTS /CHISQUARE=gender /EXPECTED=EQUAL /MISSING ANALYSIS.

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved