tft每日頭條

 > 生活

 > 多變量相關分析

多變量相關分析

生活 更新时间:2024-10-01 14:40:28
序曲

詠柳

【宋】曾鞏

亂條猶未變初黃,倚得東風勢便狂。

解把飛花蒙日月,不知天地有清霜。

這首詩把柳絮飛花的景色寫得十分生動。柳絮在東風相助之下,狂飄亂舞,鋪天蓋地,似乎整個世界都是它的了。抓住了事物的特色,使之性格化了,使人看到一個得志便猖狂的形象。

"未變初黃",準确地點出了早春季節,此時柳樹枝上剛吐新芽,正是"且莫深育隻淺黃"的新柳。 第一、二句寫淩亂柳枝憑借東風狂飄亂舞,第四句以"不知"一詞,對柳樹的愚蠻可笑加以嘲諷。 詩中把柳樹人格化的寫法,以及詩人對柳樹的明顯的貶抑與嘲諷,使這首詩不是純粹地吟詠大自然中的柳樹。 詠柳而諷世,針對的是那些得志便猖狂的勢利小人。 将狀物與哲理交融,含義深長,令人深思

雙變量相關分析

線性相關性質可由散點直觀地觀察,如下圖所示:

多變量相關分析(相關分析之雙變量相關)1

在我們看相關時,通常會采用線性相關系數表示相關的大小,一般用 r 表示,相關系數r是一個無單位的量值,其大小在 -1<=r<=1;具有以下特征:

  • r >0 為正相關, r < 0 為負相關
  • | r | 接近于1,說明相關性越好

既然有相關系數有大小,那怎麼來看相應大小呢?一般來說:

  • |r|<0.3 不存在線性關系
  • 0.3<|r|<0.5 低度線性關系
  • 0.5<|r|<0.8 顯著線性關系
  • |r|>0.8 高度線性關系

在SPSS中,提供了三個相應的檢驗方法,包括皮爾遜、肯德爾、斯皮爾曼,三者具體差别與應用場景。

  • 皮爾遜 Pearson:用于兩個連續性變量之間相關性,其條件:必須符合正态分布
  • 肯德爾 Kendall tau-b:用于反映分類變量一緻性指标,隻能在兩個變量均為有序分類時使用
  • 斯皮爾曼 Spearman:用于兩種情況: (1) 不滿足Pearson相關條件 (2) 兩個變量至少有一個等級變量
SPSS實現雙變量相關分析

示例1:某地10名一年級女大學生的胸圍(cm)與肺活量(L) ,分析兩者之間有無線性相關關系。

1. 數據錄入:

· 在SPSS的"變量視圖"中設置二個變量,x代表胸圍(cm);y代表肺活量。

多變量相關分析(相關分析之雙變量相關)2

2. 正态性檢驗

(1) 打開 分析—描述性—探索

多變量相關分析(相關分析之雙變量相關)3

(2) 正态檢驗結果

多變量相關分析(相關分析之雙變量相關)4

  • 胸圍/肺活量的P值分布為 0.2/0.12,均 大于0.05,所以符合正态分布檢驗

3. 相關檢驗

(1) 打開 分析—相關—雙變量

多變量相關分析(相關分析之雙變量相關)5

(2) 參數選擇

多變量相關分析(相關分析之雙變量相關)6

  • 變量:估計相關系數的變量,至少兩個及以上變量,必須選項
  • 相關系數:包括三個選項,皮爾遜相關系數為默認
  • 顯著性檢驗:如果了解變量間是正相關或負相關,應選擇 雙側檢驗 單選按鈕;否則,選擇 單側檢驗 按鈕
  • 标記顯著相關性:突出标記有統計意義的相關系數,輸出結果中用 * 标記 p<0.05的相關系數,用 ** 标記 p<0.01的相關系數
  • 統計:說明各類統計描述,包括輸出每個變量的均值和标準差等統計量;缺失值處理方式

4. 數據結果與說明

(1) 數據基本描述

  • 包括平均值和标準差,以及樣本數。

多變量相關分析(相關分析之雙變量相關)7

(2) 檢驗結果

  • 由下表可知,相關系數為0.504,p=0.138,無統計學意義

多變量相關分析(相關分析之雙變量相關)8

5. 語法:

***************** 正态檢驗 *******************. EXAMINE VARIABLES=x y /PLOT NPPLOT /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL. ***************** 相關檢驗 *******************. CORRELATIONS /VARIABLES=x y /PRINT=TWOTAIL NOSIG /STATISTICS DESCRIPTIVES /MISSING=PAIRWISE.

---------------------------------------------------------------------------------------------------------------------------------

示例2:某醫師收集并測定95例糖尿病患者的體重指數BMI、HOMAR指數、A/L比值等指标,分析指标之間的相關性。

1. 數據錄入:

  • 在SPSS的"變量視圖"中設置三個變量,體重指數BMI、HOMAR指數、A/L比值。

多變量相關分析(相關分析之雙變量相關)9

2. 正态性檢驗

(1) 打開 分析—描述性—探索

(2) 正态檢驗結果

多變量相關分析(相關分析之雙變量相關)10

  • 由上表可看出,BMI呈正态分布,而HOMA-R/AL不呈正态分布

3. 相關檢驗

(1) 打開 分析—相關—雙變量

多變量相關分析(相關分析之雙變量相關)5

(2) 參數選擇

  • 相關系數:選擇 斯皮爾曼

4. 數據結果與說明

(1) 檢驗結果

  • 由下表可知,BMI與HOMA-R相關系數為0.252,與AL的相關系數為 -0.32;HOMA-R與AL相關系數為-0.190;
  • 從相關系數上看,三者之間相關系數不大,但從p值上看,均有統計學意義

多變量相關分析(相關分析之雙變量相關)12

5. 語法:

***************** 正态檢驗 *******************. EXAMINE VARIABLES=BMI HOMAR AL /PLOT NPPLOT /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL. ***************** 相關檢驗 *******************. NONPAR CORR /VARIABLES=BMI HOMAR AL /PRINT=SPEARMAN TWOTAIL NOSIG /MISSING=PAIRWISE.

-----------------------------------------------------------------------------------------------------------------

示例3:某醫院測量了72名胃癌患者基因異常書與臨床分期等級情況,其中變量CP表示臨床分期(1-一期,2-二期),gn表示異常基因數目,分析臨床分析與基因遺傳數目之間存在相關性。

多變量相關分析(相關分析之雙變量相關)13

1. 相關檢驗

(1) 打開 分析—相關—雙變量

多變量相關分析(相關分析之雙變量相關)5

(2) 參數選擇

  • 相關系數:由于含有有序分類變量,選擇 肯德爾

2. 數據結果與說明

(1) 檢驗結果

  • 由下表可知,cp與gn的相關系數為0.295,其p=0.004<0.05,具有統計學意義。
  • 說明基因異常數目的增加,胃癌患者的臨床分期增高

多變量相關分析(相關分析之雙變量相關)15

3. 語法:

***************** 相關檢驗 *******************. NONPAR CORR /VARIABLES=cp gn /PRINT=KENDALL TWOTAIL NOSIG /MISSING=PAIRWISE.

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved