tft每日頭條

 > 生活

 > spss非正态數據相關性分析

spss非正态數據相關性分析

生活 更新时间:2025-01-12 06:07:36

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)1

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)2

正态分布是一種最常見,最重要的連續型随機變量分布,在做統計分析時,要判斷數據是服從正态分布,我們需要做正态性檢驗。今天我們就來學習幾種正态性檢驗的方法和實例操作。

1. 圖示法

常用的圖示法有概率圖(P-P plot)和分位數圖(Q-Q plot),p-p圖是以實際或觀察的累積頻率(X)對被檢驗分布的理論或期望累積頻率(Y)作圖。而Q-Q圖是以實際或觀察的分位數(X)對被檢驗分布的理論或期望分位數(Y)作圖,兩者以Q-Q圖的效率較高。如果所分析的數據是服從正态分布的,則在P-P圖和Q-Q圖上的數據是分布在從左下到右上的直線附近。這兩種圖示法的在SPSS上的操作如下:

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)3

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)4

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)5

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)6

上面的P-P圖上的散點幾乎都在一條直線上,故可以認為該資料服從正态分布。

Q-Q圖也在SPSS分析-描述統計裡,和P-P圖是一樣的操作。圖示法相對其他方法而言,比較直觀,方法簡單,從圖中可以直接判斷,無需計算,但這種方法的效率不高,提供的信息隻是正态性檢驗的重要補充。

2. 計算法

●(1)偏度和峰度

偏度是指分布的不對的程度和方向,用偏度系數來衡量:而峰度則是指分布與正态曲線相比的冒尖程度或扁平程度,用峰度系數來衡量。理論上,總體偏度系數=0為對稱,>0為正偏态,<0為負偏态;總體峰度系數=0為正态峰,>0為尖峭峰,<0為平闊峰。隻有同時滿足這兩個條件都接近于0,才能認為資料服從正态分布。通過SPSS 操作如下:

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)7

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)8

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)9

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)10

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)11

偏度和峰度系數近似于0,可以判斷資料分布近似于正态分布。

偏度和峰度系數隻能用于參考資料是否為正态分布,更多的适用于判斷在确定為非正态分布後,資料是為負偏态分布還是正偏态分布。最常用于正态性檢驗的是K-S檢驗和Shapiro-Wilk檢驗。

●(2)K-S檢驗

建議學習數學家柯爾莫哥(Kolmogorow)和斯米諾夫(Smirnov)創建了K-S單樣本檢驗,它假設單樣本所在的總體與指定的理論分布無顯著差異,利用樣本累計頻率分布與理論累積頻率分布的最大偏離值,來檢驗樣本分布與理論分布的符合程度。當KS統計量顯著性水平值大于臨界值P=0.05時,認為樣本來自具有理論分布的總體,符合理論分布。

K-S檢驗在SPSS上有兩種途徑,先介紹其中的K-S單樣本檢驗,另一種和Shapiro-Wilk檢驗途徑一樣,稍後再作介紹。

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)12

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)13

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)14

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)15

SPSS出來的正态性檢驗結果,當P>0.05時表明該變量服從正态分布,否則為非正态分布。結果顯示:P=0.984,故該變量服從正态分布。

●(2)Shapiro-Wilk檢驗

Shapiro—Wilk檢驗法是S.S.Shapiro與M.B.Wilk提出用順序統計量W來檢驗分布的正态性,對研究的對象總體,先提出假設認為總體服從正态分布,再将樣本量為n的樣本按大小順序排列編秩,然後由确定的顯著性水平α,以及根據樣本量為n時所對應的系數αi,根據特定公式計算出檢驗統計量W.最後查特定的正态性W檢驗臨界值表,比較它們的大小,滿足條件則接受假設,認為總體服從正态分布,否則拒絕假設,認為總體不服從正态分布。Shapiro-Wilk檢驗适用于小樣本量檢驗,SPSS操作過程如下:

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)16

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)17

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)18

提示:當樣本量在3-50時,用shapiro-wilk檢驗,當樣本量大于50時,用K-S檢驗。

SPSS出來的正态性檢驗結果,提供了K-S檢驗以及Shapiro-wilk檢驗的結果。結果顯示:K-S的P=0.200,服從正态分布;Shapiro-wilk檢驗的P=0.944,服從正态分布。

大家思考一下為什麼兩種途徑的K-S檢驗結果不一樣

這是因為第一種途徑的Kolmogorov-Smirnov檢驗,是沒有經過Lilliefors糾正或改進的,隻能做标準正态性檢驗。而第二種途徑是經過Lilliefors糾正或改進的,用于一般性的正态檢驗。

關于正态性檢驗作用的案例:

《經皮魚嘴鉗固定治療胫骨平台骨折》一文中, 應用撬撥複位、 經皮魚嘴鉗固定的方法治療胫骨平台骨折 83例,随訪其中 81 例, 得到膝關節功能評價結果見表:

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)19

分析:

本例中治療前的前三個指标的标準差是均數的2倍, 明顯不成正态分布, 而“均數±标準差”用來說明呈正态分布的集中趨勢的,用在這裡是不合适的。會犯這種錯誤的原因,是沒有做正态性檢驗,描述這樣的偏态資料的集中趨勢應該選用中位數, 描述其離散程度應選擇四分位數間距。

提示:經驗判斷一組數據是否呈正态分布,一般要求均數大于2倍的标準差,當然精确判斷是否成正态分布還是要借助SPSS等統計軟件。SPSS中檢驗正态分布的方法我在上面已經詳細介紹了。


【醫學方】來自于“醫學人”,始終緻力于服務“醫學人”,将最前沿、最有價值的臨床、科研原創文章推送給各位臨床醫師、科研人員,關注【醫學方】頭條号,更多臨床和科研相關的實用培訓課程等着你哦~

【醫學方】已推出【醫學統計學精品公益課程】、【醫學方R語言快速入門與數據清洗】、【R語言可視化及作圖】、【GEO|TCGA|Oncomine數據挖掘教程】等視頻教程。可登陸網易雲課堂,搜索“醫學方”查詢

spss非正态數據相關性分析(專治SCI論文中統計疑難雜症)20

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved