重複測量數據方差分析概述
重複測量數據(Repeated Measures Data)是醫學領域十分常見的一種數據形式,是指對同一批研究對象的同一觀測指标或多個測量指标,在不同時間點(或同一個體不同部位等)的多次測量結果。其目的就是觀察不同時間點的動态變化趨勢特征。因為數據的類型分為數值變量、分類變量和等級變量,因此重複測量數據分析就會相應産生這三類資料的重複測量數據分析,因數值變量的重複測量更為常用。
重複測量數據方差分析的分析條件如下所述:
- 正态性:處理因素的各處理水平的樣本個體之間是相互獨立的随機樣本,其總體均數服從正态分布;
- 方差齊性:相互比較的各處理水平的總體方差相等,即具有方差齊性;
- 時間點組成的協方差陣(covariance matrix)具有球形性(sphericity)特征:Box(1954)指出,若球形性質得不到滿足,則方差分析的F 值是有偏差的,這會造成過多的拒絕本來是真的無效假設(增加了I 型錯誤)。
重複測量設計最常見的情況是前後測量設計(Premeasure-Postmeasure Design)。當前後測量設計的重複測量次數m>=3時,可稱之為重複測量設計或重複測量數據。
在重複測量設計中,研究者對同一研究對象在幾個固定觀測點做動态觀測,各觀測點固定,不能随機分配;不同觀測點數據間彼此不獨立或者不完全獨立,存在一定的相關性。因此,重複測量數據有專門的統計分析方法,一是采用多元分析方法,如多元方差分析或輪廓分析;二是重複測量數據的一元方差分析。
重複測量數據設計的優缺點:
- 優點:把單個個體作為自身的對照,克服了個體之間的差異,分析時能更好地集中于研究效應;同時,把自身當做對照,研究所需的樣本就相對減少。
- 缺點:滞留效應,前面處理的效應有可能滞留到下一次的處理;潛隐效應,前面處理的效應有可能激活原本不活躍的效應;學習效應,由于逐步熟悉了實驗方式,研究對象的反應能力在後面的處理中也可能逐步提高。
SPSS實現單因素重複測量數據方差分析
示例:一項藥物代謝動力學研究,目的是對比某種藥物的不同劑型在體内的代謝速度。劑型分膠囊型和片劑型。将16名受試者随機分為2組,每組8名。一組給予膠囊,另一組給予片劑,分别在服藥後1/2/4/6/8小時測定藥物濃度。
說明:受試者服藥後藥物濃度在5個時間點上重複測量,即重複測量有5個水平。劑型對代謝速度的效應屬于組間效應,測量時間效應及其劑型的交互作用屬于組内效應。
1. 數據錄入:
- 在SPSS的“變量視圖”中設置共七個變量:id 表示編号,數值型;type 表示藥物劑型,數值型,1=膠囊型,2=片劑型;time1-time5 表示服藥後1h、2h、4h、6h、8h的血藥濃度。
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)1](/uploads3/large/pgc-image/3d6aeae6f5a94e6b96a2265c78c0703e.jpg)
2. 重複測量數據方差分析參數說明
(1) 打開 分析—一般線性模型—重複測量
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)2](/uploads3/large/pgc-image/7d4c2f048e5e4f75ba8816e332b14d63.jpg)
(2) 參數說明
a. 因子定義
- 同其他方差分析不同的是,使用“重複測量”,必須正确設置數據。在此對話框中定義主體内因子。注意,這些因子不是數據現有變量,而是在這裡定義的因子。
- 主體内因子:定義組内因素名稱,不能是數據文件中的變量名。在本例中,定義為 time
- 級别數:定義因素的水平,每個水平代表對受試者的一次觀測。在本例中,為5次測量,級别數定義為5。
- 測量名稱:定義測量的名稱,當重複測量的反應變量多于1個時,可進行多變量測量分析。
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)3](/uploads3/large/pgc-image/0a8410cf15154bcb92301284ac1998ac.jpg)
b. 重複測量
- 主體内變量:為每個組内因素水平的組合選擇一個反應變量。(n,濃度)n代表濃度的不同測量水平。必須選項。在本例中,将time1-time5 選入 主體間變量
- 主體間因子:選擇一個或多個組間因素。非必須選項。在本例中,将 劑型 選入 主體間因子。
- 協變量:定義協變量,非必須選項
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)4](/uploads3/large/pgc-image/ea815c53471745e7a90a6a3879b28fb9.jpg)
c. 模型
- 全因子:系統默認。系統将分析所有的因素變量、協變量主效應以及因素與因素間的交互作用,但不包括協變量的交互作用
- 構建項:可以僅指定其中一部分的交互或指定因子協變量交互。必須指定要包含在模型中的所有項
- 構建定制項:如果要包含嵌套項,或者想要按變量顯式構建任何項,則可選擇該項
- 因子與協變量:列出因子與協變量
- 模型:顯示選中的因素變量與交互作用
- 構建項—類型:在選擇構建項後,類型會被激活。包括交互效應、主效應、所有二階、三階、四階和五階選項。交互效應=可以建立所有被選變量的最高水平的交互效應。主效應=分析因素不同水平之間的差異,但不考慮交互項。所有二階/三階/四階/五階:表示模型中考慮所有二維/三維/四維的交互效應
- 平方和:類型1=表示分層處理平方和,僅處理主效應項,适用于平衡的ANOVA和嵌套模型。類型2=表示處理所有其他效應,進行調整,适用于平衡的ANOVA、主因子效應模型、回歸模型和嵌套模型等。類型3=表示可以處理類型1和類型2的所有效應,使用範圍廣。類型4=表示對任何效應度處理。
- 在模型中包括截距:表示計算模型中含有截距。
- 在本例中,采取默認選項,即全因子模型
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)5](/uploads3/large/pgc-image/7363e5649e784d6a9d555bbdb792ae31.jpg)
d. 對比:對比用來檢驗因子的水平之間的差值
- 因子:顯示主對話框中的因素,每個因素其後括号顯示對比的方法
- 對比:選擇對比的方法,默認為無。偏差=将每個水平(參考類别除外)的平均值與所有水平的平均值(總平均值)進行比較。因子的水平可以為任何順序。簡單=将每個水平的平均值與指定水平的平均值進行比較。當存在控制組時,此類對比很有用。可以選擇第一個或最後一個類别作為參考類别。差分=将每個水平的平均值(第一個水平除外)與前面水平的平均值進行比較。(有時候稱為逆 Helmert 對比。)Helmert=将因子的每個水平的平均值(最後一個水平除外)與後面水平的平均值進行比較。重複= 将每個水平的平均值(最後一個水平除外)與後一個水平的平均值進行比較。多項式=比較線性效應、二次效應、三次效應等等。第一自由度包含跨所有類别的線性效應;第二自由度包含二次效應,依此類推。這些對比常常用來估計多項式趨勢。
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)6](/uploads3/large/pgc-image/8e3e0de6766748f6bbcf22e4e22f6973.jpg)
e. 圖:對比用來檢驗因子的水平之間的差值
- 水平軸:水平坐标軸,從因子中選擇因素變量
- 單獨的線條:從因子列表中選入一個因素變量,對其每個取值水平,單獨做一條直線
- 單獨的圖:從因子列表中選入一個因素變量,對其每個取值水平,分别輸出一個圖形
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)7](/uploads3/large/pgc-image/865ad10a7aef48a3b25382b9362e7254.jpg)
f. 選項:顯示各類統計指标
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)8](/uploads3/large/pgc-image/7ebe7944dc154644afb5d54236607ff1.jpg)
3. 數據結果與說明
(1) 組内因素和組間因素表:組内因素間表A,測量為濃度,因素為time,水平數為5,分别對應time1-time5。組内因素間表B,因素為劑型,兩個水平。
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)9](/uploads3/large/pgc-image/33330719724b4eb5be33d4a81eba7ab3.jpg)
(2) 博克斯組間方差-協方差矩陣齊性檢驗:重複測量數據的多元方差分析是有條件的:多元正态分布、方差齊性。從下表看到,顯著性p=0.122>0.05,說明各組方差齊性。
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)10](/uploads3/large/pgc-image/b24666df7e694f73bcbaee27929a4227.jpg)
(3) 組間多因素方差分析:如下圖所示
o 因素time的4個多元檢驗統計量P<0.05,可認為不同時間點上患者血藥濃度差異有顯著性統計學意義。
o 因素time和type的交互作用p=0.253>0.05,所以不能認為劑型和時間有交互作用。
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)11](/uploads3/large/pgc-image/6097192fd3884ad38c26aaace176d6dd.jpg)
(4) 莫奇來(Mauchly’s)球對稱檢驗結果:
o 無效假設是對數據進行正交對比變化後的協方差矩陣與單位矩陣I成比例,即資料滿足H型協方差矩陣的條件。檢驗顯著性p=0.002<0.05,由此可見,數據不滿足H型方差矩陣的條件,應對重複測量一元方差分析中組内效應的自由度進行校正。
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)12](/uploads3/large/pgc-image/c3d2a351c94e47fa9d3c0d1175a6643d.jpg)
(5) 重複測量數據組内效應一元方差分析:
- 此表與一般的方差分析表的最大區别是對于每個效應項,同時給出了4種方法的檢驗結果:球對稱檢驗、Greenhouse-Geisser校正結果、Huynh-Feldt校正結果、Lower-bound校正結果。在校正結果中,Greenhouse-Geisser校正結果更常用。
- 本例由于不滿足球對稱檢驗,所有檢驗結果應以校正後的結果為準。其他3種校正的p<0.05,說明不同時間點的受試者血藥濃度的差異具有統計學意義。
- 而時間與劑型之間無交互作用(3種校正的p值均大于0.05).
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)13](/uploads3/large/pgc-image/7f326047e783477ab2db9af0aab718a0.jpg)
(6) 對比檢驗:
- 方差分析針對的是各組均數效應的差異是否有統計學意義,而重複測量數據往往反映是的統計指标的變化趨勢。
- 在本例中,重複測量了5次,所以可拟合4次曲線。
- 從下表可見time的,線性和二次曲線拟合P<0.05,也就是說血藥濃度随時間變化成線性或二次關系。但兩者哪個更符合,我們需要查看各自的F值,線性的F值=181.972>二次曲線的F值=138.939,因此,線性關系更符合。
- 在time*type中,二次曲線的p=0.023<0.05,所以可認為兩組患者服藥後1-8小時的變化趨勢是不相同的。
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)14](/uploads3/large/pgc-image/8cd5bbebd8904c5386d5aaf93fe56297.jpg)
(7) 單變量組間方差齊性檢驗
- 由下表可知,time1-time5變量的顯著性p>0.05,說明各組間方差齊性。
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)15](/uploads3/large/pgc-image/4ece2bc5e37b422bb5229b6aaa24ce2d.jpg)
(8) 重複測量數據組間效應一元方差分析
- 在下表中,給出處理因素劑型效應的統計檢驗結果:p=0.064>0.05,故不能認為服用不同劑型藥物後血藥濃度的差異有統計學意義。
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)16](/uploads3/large/pgc-image/9755623d6f80487aa483779e3a914be0.jpg)
(9) 輪廓圖
o 按照不同劑型給出5個時間點上受試者血藥濃度的均數變化曲線,可看出:兩種劑型的濃度随時間變化,基本可以看出是抛物線,支持對比檢驗的結果。
![單因素方差分析的假設檢驗過程(連續變量假設檢驗) 單因素方差分析的假設檢驗過程(連續變量假設檢驗)17](/uploads3/large/pgc-image/53d8886c3fea4b07acf74971b2177311.jpg)
(10) 研究結論:
- 本例處理的是對服用不同劑型藥物後患者的血藥濃度,以劑型為組間處理因素、以time1-time5為重複測量變量,進行重複測量數據方差分析。
- 組間效應方差分析結果發現:分析不同劑型藥物後患者血藥濃度的差異無統計學意義。
- 對組内效應的檢驗有兩種方法:一是多元方差分析:在95%的置信度下,因素time的4個多元檢驗統計量p<0.05,認為不同時間點上患者血藥濃度的差異有統計學意義;而因素time和type的交互作用p>0.05,所以不能認為劑型和時間有交互作用。二是一元方差分析,因為數據不滿足H型協方差矩陣的條件,所以采用校正結果分析,檢驗結果與多元方差分析結果相同,
- 對趨勢進行的對比結果顯示:不同劑型的二次項檢驗的p<0.05,所以兩組受試者服藥後1-8h血藥濃度的變化是不相同的。其趨勢變化可用二次曲線反映。
4. 語法
GLM time1 time2 time3 time4 time5 BY type
/WSFACTOR=time 5 Polynomial
/MEASURE=濃度
/METHOD=SSTYPE(3)
/PLOT=PROFILE(time*type) TYPE=LINE ERRORBAR=NO MEANREFERENCE=NO YAXIS=AUTO
/PRINT=ETASQ HOMOGENEITY
/CRITERIA=ALPHA(.05)
/WSDESIGN=time
/DESIGN=type.
, 更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!