通常情況下,卡方檢驗是研究分類數據與分類數據之間關系的分析方法,如研究性别和是否吸煙之間的關系。卡方檢驗通常會涉及卡方值和p值兩個名詞術語。卡方值與p值有對應關系,p值小于0.05則說明有差異存在,即性别與是否吸煙之間有聯系。
一、案例背景
某調查研究青少年近視情況,共有117人參與調查,調查者年齡範圍5~14歲,年齡段分組分别為5~8歲,8~11歲以及11~14歲,觀察不同年齡組與是否近視之間的關系。(PS:案例僅供參考,并無實際意義)部分數據如下
二、預處理
首先将“年齡”進行虛拟啞變量處理;得到3個啞變量即3個标題,分别代表‘是否5~8歲’,‘8~11歲’和‘11~14歲’;
将因變量Y與新得到的3個啞變量進行卡方檢驗。
三、結果說明
研究不同年齡段和是否近視之間的關系。結果将從基本分析結果、圖示化以及統計過程值三個方面進行說明。
基本分析結果
首先分析X分别與Y之間是否呈現出顯著性(一般觀察p值小于0.05或0.01);從上表可知:8~11歲時p值>0.05,其餘兩項均小于0.05 ,所以不同近視情況樣本對于8~11歲不會表現出顯著性差異,另外,近視情況樣本對于5~8歲, 11~14歲共2項呈現出顯著性差異。
并且5~8歲的少兒,近視占比為18.37%,占比較小,但是家長在孩子5~8歲時也需要注意保護視力。年齡11~14歲的孩子,近視占比為51.02%已經超過了一半,更加需要注意。接下來查看堆積柱形圖也許能夠更直觀的看出數據情況。
圖示化
(1)5~8歲
綠色代表5~8歲青少年近視情況,可以直觀的看出調查範圍内,不近視的人占比相對于近視群體多一些。
(2)8~11歲
綠色代表8~11歲青少年近視情況,可以直觀的看出調查範圍内,不近視的人占比與近視群體差不多,沒有很大差異。
(3)11~14歲
綠色代表11~14歲青少年近視情況,可以直觀的看出調查範圍内,近視的人占比相較于不近視群體多一些,有明顯差異。
統計過程值
從上表格可以看出,研究不同年齡對于是否近視的差異關系,由于是否為該年齡段共分為2類,膽固醇分為2類;2*2格式的卡方檢驗,期望頻數大于5的格子總數比例為100%,因而最終選擇使用pearson卡方值。
從上表可知,不同近視情況樣本對于8~11歲不會表現出顯著性差異,另外,近視情況樣本對于5~8歲, 11~14歲共2項呈現出顯著性差異。
補充說明:
Pearson卡方,yates校正卡方,也或者Fisher卡方的選擇标準如下:
下述中n代表總樣本量;E代表期望頻數;R代表X的類别個數;C代表Y的類别個數。
針對2*2(R=2,C=2)
n>=40 且 E全部>=5則使用Pearson卡方;
n>=40但其中有1個格子出現1 <=E<5則使用yates校正卡方;
任何一格子出現E <1或n<40則使用Fisher卡方;
針對R*C(R,C中任意一個大于2;且R>=2,且C>=2)
E全部>1 且 1 <=E<5格子的比例小于20% 則使用Pearson卡方,否則使用yates校正卡方。除此之外SPSSAU還提供了多重比較以及趨勢卡方研究如有需要可以進行分析在結果裡查看。
五、總結
本篇案例的數據比較特殊,結果展示包含多個卡方值和p值,研究青少年近視情況,共有117人參與調查,首先将數據進行啞變量處理,将因變量Y與新得到的3個啞變量進行卡方檢驗,對結果從基本分析結果、圖示化以及統計過程值三個方面進行說明。發現不同近視情況樣本對于8~11歲不會表現出顯著性差異,近視情況樣本對于5~8歲, 11~14歲共2項呈現出顯著性差異。并且在着重關注11~14歲的青少年視力情況。注意用眼衛生,坐姿等。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!