tft每日頭條

 > 科技

 > spss一元回歸分析數據解讀

spss一元回歸分析數據解讀

科技 更新时间:2024-08-08 10:07:56

spss一元回歸分析數據解讀(SPSSAU數據分析)1

研究場景

回歸分析實質上就是研究一個或多個自變量X對一個因變量Y(定量數據)的影響關系情況。

當自變量為1個時,是一元線性回歸,又稱作簡單線性回歸;自變量為2個及以上時,稱為多元線性回歸。例如:研究吸煙、喝酒、久坐對高血壓患病的影響關系等。

SPSSAU操作

SPSSAU左側儀表盤“通用方法”→“線性回歸”;

spss一元回歸分析數據解讀(SPSSAU數據分析)2

線性回歸的一般步驟

回歸分析用于研究X(定量或定類)對Y(定量)的影響關系,是否有影響關系,影響方向及影響程度情況如何。

第一:首先分析模型拟合情況,即通過R方值分析模型拟合情況,以及可對VIF值進行分析,判斷模型是否存在共線性問題【共線性問題可使用嶺回歸或者逐步回歸進行解決】;第二:寫出模型公式(可選);第三:分析X的顯著性;如果呈現出顯著性(p值小于0.05或0.01);則說明X對Y有影響關系,接着具體分析影響關系方向;第四:結合回歸系數B值,對比分析X對Y的影響程度(可選);第五:對分析進行總結。

回歸分析之前,可使用箱盒圖查看是否有異常數據,或使用散點圖直觀展示X和Y之間的關聯關系;回歸分析之後,可使用正态圖觀察和展示保存的殘差值正态性情況;或使用散點圖觀察和展示回歸模型異方差情況【殘差與X間的散點完全沒有關系則無異方差】。

SPSSAU結果與指标解讀

1.線性回歸分析結果

spss一元回歸分析數據解讀(SPSSAU數據分析)3

spss一元回歸分析數據解讀(SPSSAU數據分析)4

計算:

(1)t值

t=回歸系數/回歸系數的标準誤;t=常數項/常數項的标準誤;例:0.588/0.199=2.961

(2)VIF(方差膨脹因子)

spss一元回歸分析數據解讀(SPSSAU數據分析)5

對于VIF說明:其值介于1~之間。其值越大,自變量之間存在共線性的可能越大;

(3)R2

;它是判斷線性回歸直線拟合優度的重要指标,表明決定系數等于回歸平方和在總平方和中所占比率,體現了回歸模型所解釋的因變量變異的百分比;例:R2=0.775,說明變量y的變異中有77.5%是由變量x引起的,R2=1,表明因變量與自變量成函數關系。

(4)調整R2

spss一元回歸分析數據解讀(SPSSAU數據分析)6

其中,k為自變量的個數;n為觀測項目。自變量數越多,與R2的差值越大;例:

spss一元回歸分析數據解讀(SPSSAU數據分析)7

(5)F值

參考下方ANOVA表格(中間過程)

F=回歸均方/殘差均方;0.254/0.237=1.068

從上表可知,将價格,性能,品牌偏好作為自變量,而将筆記本是否購買作為因變量進行線性回歸分析,從上表可以看出,模型公式為:筆記本是否購買=0.588 0.033*價格-0.116*性能 0.061*品牌偏好,模型R方值為0.032,意味着價格,性能,品牌偏好可以解釋筆記本是否購買的3.2%變化原因。對模型進行F檢驗時發現模型并沒有通過F檢驗(F=1.068, p=0.367>0.05),也即說明價格,性能,品牌偏好并不會對筆記本是否購買産生影響關系,因而不能具體分析自變量對于因變量的影響關系,分析結束。

2.模型彙總(中間過程)

spss一元回歸分析數據解讀(SPSSAU數據分析)8

spss一元回歸分析數據解讀(SPSSAU數據分析)9

補充說明

:一般對于時間序列分析才會考慮DW值:

  1. 當殘差與自變量互為獨立時,DW≈2;
  2. 當相鄰兩點的殘差為正相關時,DW<2;
  3. 當相鄰兩點的殘差為負相關時,DW>2;

3.ANOVA表格(中間過程)

spss一元回歸分析數據解讀(SPSSAU數據分析)10

F=回歸均方/殘差均方;0.254/0.237=1.068;

對模型進行F檢驗時發現模型并沒有通過F檢驗(F=1.068,p=0.367>0.05),也即說明價格,性能,品牌偏好并不會對筆記本是否購買産生影響關系,因而不能具體分析自變量對于因變量的影響關系。

4.回歸系數(中間過程)

spss一元回歸分析數據解讀(SPSSAU數據分析)11

95%CI:是指由樣本統計量所構造的總體參數的估計區間(置信區間)。

補充說明:SPSSAU還提供了coefPlot、預測模型等。例如下圖:

spss一元回歸分析數據解讀(SPSSAU數據分析)12

spss一元回歸分析數據解讀(SPSSAU數據分析)13

疑難解惑

1.回歸分析缺少Y?

回歸分析是研究X對于Y的影響。有時候由于問卷設計問題,導緻直接缺少了Y(沒有設計對應的問卷題項),建議可以考慮将X所有題項概括計算平均值來表示Y。(使用“ 生成變量”的 平均值功能)(另提示:如果問卷中并沒有設計出Y對應的題項,沒有其它辦法可以處理)

2.影響關系的大小,那個自變量影響更大一點?

如果說自變量X已經對因變量Y産生顯著影響(P< 0.05),還想對比影響大小,建議可使用标準化系數( Beta)值的大小對比影響大小,Beta值大于0時正向影響,該值越大說明影響越大。Beta值小于0時負向影響,該值越小說明影響越大。

3.回歸分析之前是否需要先做相關分析?

一般來說,回歸分析之前需要做相關分析,原因在于相關分析可以先了解是否有關系,回歸分析是研究有沒有影響關系,有相關關系但并不一定有回歸影響關系。當然回歸分析之前也可以使用散點圖直觀查看數據關系情況等。

4.常數項值很大或者很小?

常數項無實際意義,包括其對應的顯著性值等均無實際意義,隻是數學角度上一定存在而已。

5.回歸系數非常非常小或者非常非常大?

如果說數據的單位很大,不論是自變量X還是因變量Y;此種數據會導緻結果裡面的回歸系數出現非常非常小,也或者非常非常大。此種情況是正常現象,但一般需要對數據進行統一取對數處理,以減少單位問題帶來的‘特别大或特别小的回歸系數’問題。

總結

以上就是多元線性回歸分析的指标解讀,對于線性回歸的操作步驟具體可以查看推薦文章,線性回歸在實際研究裡非常常見,但是理論與實際操作會有較大“距離”,具體還需要結合實際研究考察。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved