正态性判定結果,意味着不同分布的定量數據,統計分析手段不同。這一不同體現在統計描述和統計比較(專業來說是統計推斷),統計比較内容後期逐步展開,今日首先介紹下定量數據正态和偏态分布的的統計描述方法、SPSS操作和統計表格繪制。
定量數據統計描述方法
正态與近似正态分布描述
正态分布,包括近似正态分布,可以采用均數描述數據的平均值,采用标準差來描述離散程度。
偏态分布分統計描述
偏态分布,特别是嚴重偏态分布,可以采用中位數(M)描述數據的平均值,采用四分位數間距(IQR)描述離散程度。
其中四分位數間距有兩種形式,第一種直接寫出25%的分位數和75%的分位數(P25, P75),第二種為P75-P25的差值。
SPSS操作方法:分析—描述統計—探索
SPSS可以給出分組描述和整體描述,其操作過程就在正态性檢驗中
(1)單組整體描述:因。變量放入觀察指标
(2)分組描述:因變量不變,因子列表加上分組變量。(3)百分位數獲得
第(1)步、第(2)可以給出結果的均數、标準差、方差、中位數、四分位數間距,但給不了P25, P75。
P25、P75操作如下圖:統計選項(這個操作很重要,諸位要掌握)
(4)SPSS分析結果:
單組分析結果:下面這張表給了均數、中位數、四分位數、标準差。
下表給了P25、P75的值(上四分位數和下四分位數),諸位看第一行結果就可以(加權平均)。(這個結果挺重要的!)
分組描述結果:
定量數據統計描述方法
一般情況下,醫學研究論文,常見的數據有定量數據和定性數據,定量數據又有正态分布和偏态分布,采用的一般是描述均數和中位數;定性數據,一般采用率和構成比描述。同時,往要采用差異性比較的方法來探讨不同組間有無統計學差異。這些結果在論文中往往要同時呈現在一張表格中。特别是統計學分析的第一張表格,研究對象基本特征及其組間差異性。
案例:病例對照研究,分析膽道癌發生的影響因素。根據病例對照研究的特征,人群分為發病組和對照組,探讨膽道癌與他汀類藥物的關系。
一般情況下,任何一個研究的第一張表格是描述患者的基本特征以及在病例和對照組之間的分布差異性。
研究人群分為病例組和對照組,特征包括年齡(定量正态)、性别、體重指數、慢性病曆史(糖尿病、膽結石、肝炎病毒感染、冠心病)、健康行為(又包括運動與飲食)、患者的轉氨酶(定量、偏态)、甲胎蛋白(定量、偏态)。
那麼這組數據既有整體、又有偏态、又有定性或者率相關數據,還有差異性比較的結果,如何整合到同一張表格裡呢?
正确的表格繪制方法有以下特征:
1.表格包括總人群、病例組人群、對照組人群和P值三列,其中總體人群列可以省略。還有各組差異性比較的結果(P值,後續課程會進行介紹)。
2.正态分布的數據描述有兩種Mean±SD和Mean(SD),但國内學者喜歡用Mean±SD,但國外也有Mean(SD)形式。
鄭老師:醫學統計論文較為規範的統計表格
3.偏态分布數據,不能用Mean±SD來描述,必須用中位數和四分位數間距M(IQR)來開展。當然也有另外一種形式,是中位數(下四分位數P25、上四分位數P75)的形式(這種形式已經成為主流)。
4.分類數據,一般用n和%共同來描述,列出所有組别的絕對數和相對數,形成多行多列的格式,一般相對數的小數點不能超過2位。
5. 有些分類數據,特别是二分類數據,可以隻呈現陽性率的數據,比如有沒有患糖尿病,有沒有膽結石等,有健康運動比例、健康飲食的比例。
6.與表格中的數值一般保留1-2位小數不同,所有的P值應該提供三位小數。
7.現在國際上對表格左對齊還是右對齊沒有一緻意見,一般來說,常見以某一些數學符号作為對其标志,比如小數點、括号、±等。但總的來說,什麼樣的對齊方式較為美觀,就采取何種對其方式。
8.所有的變量要注明度量單位(如果有的話)、表格數據的含義。
9.本表格的P值請先不用管,這是後期統計分析方法中差異性分析的結果。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!