tft每日頭條

 > 科技

 > spss如何做分析

spss如何做分析

科技 更新时间:2024-08-31 02:21:34

spss如何做分析(SPSSAU數據分析)1

案例背景

研究高管信息以及企業規模資産對于研發投入的影響,其中高管信息包括,高管研究平均年齡、高管平均任期(天)、高管平均學曆以及高管團隊人數,具體的名詞解釋請參考下方表格,此案例主要利用SPSSAU回歸分析高管信息以及企業規模資産對于研發投入的影響。并對結果進行解釋,首先将搜集的數據進行處理。

spss如何做分析(SPSSAU數據分析)2

數據處理

1.減少異方差

将數據進行對數處理,目的是将單位進行壓縮,以減少在某些情況下,數據的整個值域中的在不同區間的差異帶來的影響不同(特别注意:對數處理的數據應該大于0,如果小于等于0需要在excel中處理)

spss如何做分析(SPSSAU數據分析)3

2.異常值檢查

在數據分析之前,首先需要進行數據查看,案例是問卷數據所以對于數據進行查看是否有異常值,常見的方法包括利用SPSSAU描述分析看數據是否正常,散點圖以及箱線圖。

異常值的判斷标準如下:

spss如何做分析(SPSSAU數據分析)4

檢驗數據是否有異常值的方法:

spss如何做分析(SPSSAU數據分析)5

異常值處理方法:

spss如何做分析(SPSSAU數據分析)6

此案例對于異常值檢查使用散點圖:

spss如何做分析(SPSSAU數據分析)7

由散點圖可以看出橫坐标代表企業規模資産,縱坐标代表研發投入,可以看出異常值是14.610,所以将數據進行篩選處理,處理如下:

spss如何做分析(SPSSAU數據分析)8

處理後進行再次檢查,可使用SPSSAU可視化的箱線圖。

spss如何做分析(SPSSAU數據分析)9

基本關系查看

數據處理後,我們切入正題,回歸分析前需要進行基本關系查看,其中包括因變量與自變量的線性關系、相關關系以及因變量的正态性,接下來一一說明。

1.線性關系

做數據的散點圖(由于數據過多,所以分析時利用SPSSAU提供的Bins處理,Bins=25),觀察因變量與自變量之間是否具有線性特點。

spss如何做分析(SPSSAU數據分析)10

從上圖中可以看出,研發投入和高管平均年齡、高管平均任期、高管平均學曆、高管團隊人數以及企業規模資産存在線性關系,其中Y軸為因變量研發投入。X軸為自變量。

2.相關關系

相關分析是研究有沒有關系,回歸分析是研究影響關系。明顯地,相關分析是基礎,然後再進行回歸分析。首先需要知道有沒有相關關系;有了相關關系,才可能有回歸影響關系;如果沒有相關關系,是不應該有回歸影響關系的。

spss如何做分析(SPSSAU數據分析)11

從上圖可以看出,研發投入(元)與高管平均年齡, 高管平均任期(天), 高管平均學曆, 高管團隊人數, 企業規模資産(元)共5項之間的相關關系系數值呈現出顯著性,具體來看,研發投入(元)和高管平均年齡之間的相關系數值為-0.189,并且呈現出0.01水平的顯著性,因而說明研發投入(元)和高管平均年齡之間有着顯著的負相關關系。研發投入(元)和高管平均任期(天)之間的相關系數值為0.099,并且呈現出0.05水平的顯著性,因而說明研發投入(元)和高管平均任期(天)之間有着顯著的正相關關系。研發投入(元)和高管平均學曆之間的相關系數值為0.266,并且呈現出0.01水平的顯著性,因而說明研發投入(元)和高管平均學曆之間有着顯著的正相關關系。研發投入(元)和高管團隊人數之間的相關系數值為0.236,并且呈現出0.01水平的顯著性,因而說明研發投入(元)和高管團隊人數之間有着顯著的正相關關系。研發投入(元)和企業規模資産(元)之間的相關系數值為0.619,并且呈現出0.01水平的顯著性,因而說明研發投入(元)和企業規模資産(元)之間有着顯著的正相關關系。

3.正态性

spss如何做分析(SPSSAU數據分析)12

spss如何做分析(SPSSAU數據分析)13

橫軸各坐标為各分組的起止範圍;左邊Y軸代表的是正态曲線的概率密度;右側Y軸代表頻率。從圖中可以看出因變量研發投入呈正态分布。對于正态檢驗SPSSAU還提供了其它方法,比如P-P/Q-Q圖、正态檢驗等。

回歸結果

通過基本關系查看可以發現因變量和自變量之間具有線性關系,以及對于相關關系也有說明,處理後的因變量符合正态性,對年份進行啞變量處理,特别說明啞變量處理後在分析時要少放一項作為參照項,模型效果從F檢驗、拟合優度、多重共線性以及異方差檢驗四個方面進行說明。

spss如何做分析(SPSSAU數據分析)14

1.模型效果

(1)F檢驗

spss如何做分析(SPSSAU數據分析)15

從上表可以看出,離差平方和為293.242,殘差平方和為156.720,而回歸平方和為136.522。回歸方程的顯著性檢驗中,統計量F=49.903,對應的p值遠遠小于0.05,被解釋變量的線性關系是顯著的,可以建立模型。建立模型後,需要查看模型拟合優度是否可以,其中就可以查看R方與調整R方值。

(2)拟合優度

spss如何做分析(SPSSAU數據分析)16

從上表可知,将高管平均年齡、高管平均任期、高管平均學曆、高管團隊人數以及企業規模資産作為自變量,而将研發投入作為因變量進行線性回歸分析,從上表可以看出,模型R方值為0.466,調整R方為0.456,其中R方是決定系數,模型拟合指标。反應Y的波動有多少比例能被X的波動描述。調整R方也是模型拟合指标。當x個數較多是調整R比R更為準确。意味着社會資源, 教育水平, 科技發展可以解釋創業可能性的46.6%變化原因。可見,模型拟合優度良好,說明被解釋變量可以被模型解釋的部分較少。接下來查看變量是否具有多重共線性。

補充說明:

R平方值表示模型拟合能力的大小,比如0.3表示自變量X對于因變量Y有30%的解釋能力。這個值介于0~1之間,越大越好。但實際研究中并沒有固定的标準,有的專業0.1甚至0.05這樣都可以,但有的專業卻常常出現0.8以上。一般情況下隻需要報告此值即可,不用過多關注其大小,原因在于多數時候我們更在乎X對于Y是否有影響關系即可。

(3)多重共線性

spss如何做分析(SPSSAU數據分析)17

VIF值用于檢測共線性問題,一般VIF值小于10即說明沒有共線性(嚴格的标準是5),有時候會以容差值作為标準,容差值=1/VIF,所以容差值大于0.1則說明沒有共線性(嚴格是大于0.2),VIF和容差值有邏輯對應關系,因此二選一即可,一般描述VIF值。在【線性回歸】分析時,SPSSAU會智能判斷共線性問題并且提供解決建議。 結果中可以看出,變量的VIF值均小于5,所以此案例不存在多重共線性的問題。

但是如果存在多重共線問題,建議三種解決方法一是使用逐步回歸分析(讓模型自動剔除掉共線性過高項);二是使用嶺回歸分析(使用數學方法解決共線性問題),三是進行相關分析,手工移出相關性非常高的分析項(通過主觀分析解決),然後再做線性回歸分析。

(4)異方差檢驗

在計量研究中,異方差問題非常重要,嚴重的異方差問題會影響模型估計和模型檢驗等,因而在OLS回歸時需要對其進行檢驗,如果出現異方差問題則需要進行處理等。将殘差與自變量進行相關分析,觀察殘差與自變量是否有相關關系。

spss如何做分析(SPSSAU數據分析)18

從上表可知,針對異方差情況,使用懷特(White)檢驗和BP檢驗兩種方法進行檢驗。檢驗原假設為模型沒有異方差,上表顯示兩種檢驗均拒絕原假設(p<0.05),說明模型存在異方差,建議可使用Robust穩健标準誤回歸方法進行研究,以解決異方差問題。返回分析頁面進行勾選Robust穩健标準誤即可。

spss如何做分析(SPSSAU數據分析)19

2.模型結果

回歸的中間過程包括F檢驗、拟合優度、多重共線性以及異方差檢驗,這些都是在分析前需要進行觀測與分析的,接下來将從分析結果以及穩健性檢驗進行對模型結果的闡述。

(1)分析結果

spss如何做分析(SPSSAU數據分析)20

上表可知,将高管平均年齡, 高管平均任期(天), 高管平均學曆, 高管團隊人數, 企業規模資産(元)作為自變量進行OLS回歸分析,并且使用Robust穩健标準誤回歸方法進行研究,從上表可以看出,模型R方值為0.463,意味着高管平均年齡, 高管平均任期(天), 高管平均學曆, 高管團隊人數, 企業規模資産(元)可以解釋研發投入(元)的46.31%變化原因。對模型進行F檢驗時發現模型通過F檢驗(F=67.196,p=0.000<0.05),也即說明高管平均年齡, 高管平均任期(天), 高管平均學曆, 高管團隊人數, 企業規模資産(元)至少一項會對研發投入(元)産生影響關系,以及模型公式為:研發投入(元)=1.644-1.315*高管平均年齡 0.004*高管平均任期(天) 1.185*高管平均學曆 0.339*高管團隊人數 0.878*企業規模資産(元)。總結分析可知:高管平均學曆, 高管團隊人數, 企業規模資産(元)會對研發投入(元)産生顯著的正向影響關系。以及高管平均年齡會對研發投入(元)産生顯著的負向影響關系。但是高管平均任期(天)并不會對研發投入(元)産生影響關系。

spss如何做分析(SPSSAU數據分析)21

(2)穩健性檢驗

穩健性檢驗是指模型的穩定性,使用多種形式時模型均穩定,應該顯著的項還是顯著,不顯著的依舊不顯著。一般情況下建議在線性回歸時考慮加入控制變量,和不加入控制變量兩種情況下對比模型的穩定性,當然也可以使用多種研究方法比如線性回歸,逐步回歸,分層回歸等,多種方法測試同一個變量的顯著性情況是否有着變化,如果無論如何均穩定或者極個别在變化,均說明模型具有穩健性。方法說明如下:

spss如何做分析(SPSSAU數據分析)22

本次分析選擇第一個分析方法,對于放置控制變量與不放置控制變量進行分析對比(本案例中控制變量為年份):

spss如何做分析(SPSSAU數據分析)23

高管平均學曆, 高管團隊人數, 企業規模資産(元)會對研發投入(元)産生顯著的正向影響關系。以及高管平均年齡會對研發投入(元)産生顯著的負向影響關系。但是高管平均任期(天)并不會對研發投入(元)産生影響關系。總結可知,前後對比發現自變量顯著性未發生改變模型具有穩健性。

總結

利用SPSSAU回歸分析高管信息以及企業規模資産對于研發投入的影響。首先對數據進行處理包括數據取對數以及異常值檢查。緊接着對于分析的基本關系進行查看,包括線性關系,相關關系以及正态性,對處理後的數據進行分析,從兩個方面進行闡述,包括模型效果以及模型結果,模型效果從F檢驗、拟合優度、多重共線性以及異方差檢驗四個方面進行說明。發現模型具有異方差性,使用Robust穩健标準誤回歸方法進行研究。得到的結論是:高管平均學曆, 高管團隊人數, 企業規模資産(元)會對研發投入(元)産生顯著的正向影響關系。以及高管平均年齡會對研發投入(元)産生顯著的負向影響關系。對分析後的模型進行穩健性檢驗發現模型具有穩健性,分析結束。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved