tft每日頭條

 > 科技

 > spss快速學習

spss快速學習

科技 更新时间:2024-12-27 00:38:19

作者:鄭铿城,經濟學博士,數學建模指導教練

開頭,和大家講個笑話

spss快速學習(零基礎學習SPSS軟件)1

spss軟件在數據處理分析中有較廣的運用,适合各類學習群體,就算學習者不會編程,也可以通過spss軟件實現數據的處理和模型的建立。以下歸納了spss軟件中一些比較常用的功能和操作步驟,全是幹貨哦!

spss快速學習(零基礎學習SPSS軟件)2

1.熟悉變量窗口和數據窗口

數據窗口是我們打開spss一開始時,其頁面所展現的窗口,主要用于輸入相關的數據,在其頁面中有相關的操作欄項目,可以進行對數據的具體分析。如下:

spss快速學習(零基礎學習SPSS軟件)3

對于變量窗口,是對數據的變量做相應的改動調整的窗口,包括對數據的名稱、類型、寬度、小數位、标簽、度量标準等等。

spss快速學習(零基礎學習SPSS軟件)4

在spss左下方有變量窗口和數據窗口的轉換按鈕,即可選擇不同的窗口進行操作:

spss快速學習(零基礎學習SPSS軟件)5

2.學會數據輸入

數據輸入有兩種,一種是手動輸入數據,一種是通過已經有的excel數據,對數據進行鍵入。手動輸入比較簡單,就是在數據窗口把自己想要用的數據打入即可,然後點擊左下方選擇變量窗口,對數據的屬性進行相應的調整。對于使用已經有的數據,并把數據鍵入,要注意以下問題:

首先數據是以列來排序,即每一列代表一種數據,如果你的數據是每一行代表一種,那麼你需要對你的數據進行轉置處理。

比如我們鍵入以下數據:

spss快速學習(零基礎學習SPSS軟件)6

那麼在spss窗口中,點擊“文件”--“打開”--“數據”

選擇想要鍵入的數據,會彈出這樣一個頁面,注意,要選擇打鈎。

spss快速學習(零基礎學習SPSS軟件)7

初試數據鍵入以後,效果是這樣的:

spss快速學習(零基礎學習SPSS軟件)8

我們可以點擊到變量窗口,進行相關的調整,使數據看起來更加的好看一點,比如統一小數位,調整數據所在行的寬度等,結果如下:

spss快速學習(零基礎學習SPSS軟件)9

3.數據管理

這個就很簡單了,一些相關的參考書中,主要講了把數據進行縱向和橫向的合并,對數據進行拆分,對數據進行彙總,對數據進行加權,對數據進行查找。這些都很簡單,比較有意思的應該是數據的彙總和加權,數據彙總可以通過數據的均值、中值、總和、标準差等标準進行彙總,數據的加權通過“數據”--“加權個案”實現。

4.統計描述分析

用spss進行統計描述分析,主要有三個闆塊,一個是頻數分布描述;一個是描述性統計分析;一個是探索性分析。

首先講一下頻數分布:頻數分布就是用來對數據的集中趨勢和離散程度進行描述,通過頻數分布圖、條圖和直方圖等,來更加形象的說明數據的分布特征。步驟是:“分析”--“描述統計”--“頻率”,通過相應程序的操作,假設輸入以下數據:

spss快速學習(零基礎學習SPSS軟件)10

通過頻數分布描述的spss步驟運行,同時進行相關的設置:

spss快速學習(零基礎學習SPSS軟件)11

spss快速學習(零基礎學習SPSS軟件)12

得到的結果如下:

spss快速學習(零基礎學習SPSS軟件)13

上圖反映的是這些輸入數據的均值、中值、衆數等特性。

spss快速學習(零基礎學習SPSS軟件)14

上圖反映的是頻率的一個情況,可以清楚的看出每個型号都頻率。

spss快速學習(零基礎學習SPSS軟件)15

最後也得出了上圖這個直方圖。

然後我們來說一下描述性統計分布,命令為:“分析”--“描述統計”--“描述”。這個主要也是用來計算描述集中趨勢和離散趨勢的各種統計量。(此外還有一個重要的功能是進行标準化變換即Z變換),這個和上面那個頻數分布其實大同小異吧,都是用來體系數字的特征的。

舉個栗子,我鍵入以下數據,進行描述性分析:

spss快速學習(零基礎學習SPSS軟件)16

通過的運行,最終得出的結果如下圖:

spss快速學習(零基礎學習SPSS軟件)17

(确實,也就是各類統計量,像極大值極小值标準差等)

最後,該部分的最後一個版塊,即探索性分析,這個的話是建立在對數據有一定的了解的基礎上,對數據進行更加深入的分析(你可以理解為這種方法做出的圖看起來更加牛逼了)

舉個栗子,我還是用一些數據進行操作:

spss快速學習(零基礎學習SPSS軟件)18

spss快速學習(零基礎學習SPSS軟件)19

spss命令為:“分析”--“描述性統計”--“探索”。操作如下:

spss快速學習(零基礎學習SPSS軟件)20

最終得到的結果:

spss快速學習(零基礎學習SPSS軟件)21

上面這個當然就是簡單的數據描述。

spss快速學習(零基礎學習SPSS軟件)22

還有一個以“南北”分開進行的描述。

還可以得到一個這樣的圖:

spss快速學習(零基礎學習SPSS軟件)23

還可以操作出莖葉圖等圖形。

在前面的操作中,我們從輸出窗口可以看到代碼,其實這就是spss的運行代碼,系統自動生成的,如果你是用spss進行建模寫作的話,這些代碼就可以複制到你的論文的附錄部分。如:

spss快速學習(零基礎學習SPSS軟件)24

5.均值檢驗

均值檢驗也叫means檢驗,很好理解,就是求數值均值的過程,在spss中的命令為“分析”--“比較均值”--“均值”,這個比較easy,也好理解,就不做例子。

spss快速學習(零基礎學習SPSS軟件)25

這個比較均值窗口中包括了像單樣本T檢驗,獨立樣本T檢驗,配對樣本T檢驗和單因素分析,這些内容其實也是大同小異,可以輸入數據嘗試輸出結果,總結一點:在輸出結果中要看到sig值,也就是我們說的P值,這個值如果是小于0.05的(顯著性一般為0.05),那麼就表明兩個數據個體是有差異的。你也可以從概率的角度來理解(p值如果小于顯著性水平,則應該拒絕原假設,認為樣本之間存在差異)。當然我們也可以對這些概率做一個區分:

單樣本T檢驗的目的是利用某總體的樣本數據,推斷該總體的均值是否與指定的檢驗值存在顯著性差異;

獨立樣本T檢驗的目的是利用兩個總體獨立的樣本,推斷兩個總體的均值是否有差異。

匹配樣本T檢驗的目的是用兩個不同的總體的配對樣本,來推斷兩個總體的均值是否存在差異。

其實吧,都是在分析兩個東西的差異性。怎麼從他輸出的結果來看呢,其實就抓住P值來分析即可。

6.方差分析

在比較兩組資料的均數是否相等的時候,可以采用的是T檢驗,當組數大于等于3的時候,就應該使用方差分析。方差分析的原理不再贅述。在進行方差分析中,要學會通過LSD方法看出組數之間的差異。

具體命令:“分析”--“比較均值”--“單因素ANOVA”

在設置對話框中選擇LSD方法,從輸出結果來進行分析。

舉個栗子:有三組企業和對應的壽命:

spss快速學習(零基礎學習SPSS軟件)26

spss快速學習(零基礎學習SPSS軟件)27

spss快速學習(零基礎學習SPSS軟件)28

利用單因素ANOVA方法,選取LSD進行操作

spss快速學習(零基礎學習SPSS軟件)29

得到的結果如下:

spss快速學習(零基礎學習SPSS軟件)30

由上表可知顯著性的大小為0.05,那麼如果兩個組别的顯著性大小比0.05大,則接受原假設,認為兩個組别是無差異的,那麼通過上表可以看出1組和3組是無差别的,1組合2組是有差别的,2組合3組也是有差别的。

7.利用spss進行繪圖

繪圖操作是一項重要技能,利用spss進行繪圖,操作簡單快捷,隻需要對數據進行選擇,然後點擊自己想要繪制的圖形格式即可。

spss快速學習(零基礎學習SPSS軟件)31

當然繪圖的時候你數據窗口中要有數據,具體可以自己實驗一下。

spss快速學習(零基礎學習SPSS軟件)32

假設我們要繪制一個時間為橫坐标,GDP為縱坐标的二維直方圖,即可進行操作得到如下結果:

spss快速學習(零基礎學習SPSS軟件)33

當然在第二個繪圖指令中,還可以進行這樣的操作:

spss快速學習(零基礎學習SPSS軟件)34

你選擇幾個變量,就會有相應的幾維圖形。(最多構造三維哦)

在繪圖中,點擊“舊對話框”會顯示下面内容:

spss快速學習(零基礎學習SPSS軟件)35

同理根據自己的需求進行圖形的繪制。

8.缺失值分析

理解這個很簡單,就是我們在數據收集的過程中,可能存在數據的缺失,那麼數據的缺失就會對我們的處理結果造成一定的影響。利用spss軟件對缺失值進行處理,使我們分析的相關結果更加合理。

對缺失值的處理方法有很多,包括什麼直接删除法、或者用什麼數據來進行替代,也可以用EM或者回歸的方法,從未缺失的數據分布情況中推算出缺失的數據的估計值。“分析”--“缺失值分析”

首先我對之前的那份GDP數據進行故意挖空,形成缺失現象,便于進行分析:

spss快速學習(零基礎學習SPSS軟件)36

主要挖了三處空,然後利用spss缺失值分析中的EM進行數據的缺失處理,得到下圖:

spss快速學習(零基礎學習SPSS軟件)37

這樣就完成了缺失值的處理,當然也可以用回歸的方法。

spss快速學習(零基礎學習SPSS軟件)38

spss快速學習(零基礎學習SPSS軟件)39

9.簡單線性回歸和相關性分析

先講相關性,相關性用r表示,r值為正則正相關,反之則為負相關。r的絕對值越大,則相關性越強。可以用spearman等級相關系數來看相關程度。

spss快速學習(零基礎學習SPSS軟件)40

舉個栗子:利用下面數據做相關性分析并構造回歸模型。

spss快速學習(零基礎學習SPSS軟件)41

spss快速學習(零基礎學習SPSS軟件)42

當然kendall和pearson相關系數也是可以表示相關性的,都差不多。

spss快速學習(零基礎學習SPSS軟件)43

通過這個pearson相關系數(等于0.971)可以看出兩個變量的相關性很強!

spss快速學習(零基礎學習SPSS軟件)44

得到的spearman系數和kendall系數也是接近于1的,表明兩個變量之間确實存在的正的相關性。再利用回歸方法确定出模型:

spss快速學習(零基礎學習SPSS軟件)45

如下圖所示進行相關設置:

spss快速學習(零基礎學習SPSS軟件)46

進行操作,得到的結果如下:

spss快速學習(零基礎學習SPSS軟件)47

通過上表,則我們的回歸模型為:(設患病率為Y,碘含量為X)

Y=17.484 4.459X。

spss快速學習(零基礎學習SPSS軟件)48

10.Logistic回歸模型

如果要分析的數據是分類變量,那麼可以采取logistic回歸模型對數據進行分析,首先講一下二項分類的logistic回歸,該模型的方程為:

P=1/(1 EXP(-b0 b1x1 b2x2 ... bnxn))

通過spss确定出上述方程的系數,即可确定出該模型。

spss快速學習(零基礎學習SPSS軟件)49

舉個栗子:

spss快速學習(零基礎學習SPSS軟件)50

查看變量窗口:

spss快速學習(零基礎學習SPSS軟件)51

y表示康複情況,y=0則是沒有康複,y=1則是康複,x1表示病情的嚴重程度,x1=0則表示病情不嚴重,x1=1則表示病情嚴重。x2表示療法,x2=0則表示新療法,x2=1則表示舊療法。

并進行如下設置:

spss快速學習(零基礎學習SPSS軟件)52

結果為:

spss快速學習(零基礎學習SPSS軟件)53

通過上表,可以得到二元logistic回歸模型為:

P(Y=1)=1/(1 EXP(-0.928-0.909X1-1.669X2))

即療法的新舊對于康複情況是有影響的,當療法比較就新的時候,康複的概率會更高一點。

當然logistic回歸除了有二項的以外,還有有序的logistic回歸,條件logistic回歸等。方法類似。

spss快速學習(零基礎學習SPSS軟件)54

方法總結,對于該部分的logistic回歸方程,首先你要确定你要使用哪個類型的logistic回歸模型,然後去尋找該模型的一個表達式,再通過spss軟件,求出系數,把系數代入表達式,即可構造出模型。比如上述中确定了二項logistic回歸的表達式:

spss快速學習(零基礎學習SPSS軟件)55

那麼通過spss确定系數以後,代入表達式即可得出模型。

spss快速學習(零基礎學習SPSS軟件)56

11.聚類方法

物以類聚,人以群分。對數據或者樣本進行聚類,了解對象的類别,具有一定的探索性。聚類的原理是什麼呢,很簡單,就是通過距離和相似系數進行聚類,其原理不再說明。

常用的有k均值聚類和系統聚類。

舉個栗子:

spss快速學習(零基礎學習SPSS軟件)57

對以上數據進行聚類:“分析”--“分類”-“k-均值聚類”

spss快速學習(零基礎學習SPSS軟件)58

同時确定分類數:

spss快速學習(零基礎學習SPSS軟件)59

spss快速學習(零基礎學習SPSS軟件)60

由于設置的是聚類成兩類,所以結果顯示如下:

spss快速學習(零基礎學習SPSS軟件)61

可以看出不同案例号對應的類别,當然你也可以嘗試設置成4類等,看看結果會發生什麼變化。(如下)

spss快速學習(零基礎學習SPSS軟件)62

也可以進行系統聚類:比如對這些數據進行系統聚類:

spss快速學習(零基礎學習SPSS軟件)63

得到的一個垂直冰柱圖和樹狀圖:

spss快速學習(零基礎學習SPSS軟件)64

spss快速學習(零基礎學習SPSS軟件)65

12.主成分分析、因子分析

這裡用的是一個降維的思想,從一堆變量中,選取出一些主要變量進行分析。主要還是通過特征根的大小來衡量。

spss快速學習(零基礎學習SPSS軟件)66

主成分分析和因子分析到底有什麼異同?大家可以先自行了解一下,提示:主成分分析實質是線性變換,無假設檢驗,因子分析是統計模型,有些因子模型可以做假設檢驗,其次主成分分析在spss操作中不需要旋轉,而因子分析則需要旋轉。

舉一個因子分析例子,并通過構造碎石圖、做球形檢驗和旋轉來看看因子分析的具體操作:

spss快速學習(零基礎學習SPSS軟件)67

其x1到x9分别表示:

spss快速學習(零基礎學習SPSS軟件)68

選擇“分析”--“降維”--“因子分析”:得到的結果如下:

spss快速學習(零基礎學習SPSS軟件)69

碎石圖怎麼看?看斜率,前3的成分的斜率比較陡峭,故可以用前三個元素來代表所有元素。

spss快速學習(零基礎學習SPSS軟件)70

從球形檢驗這個表,可以看出KMO值大于最低标準0.5,所以适合做因子分析,同時P值小于0.001,适合做因子分析。

也可以看到沒有旋轉之前的成分矩陣和旋轉以後的成分矩陣:

spss快速學習(零基礎學習SPSS軟件)71

spss快速學習(零基礎學習SPSS軟件)72

那麼我們就可以去說明前3個因子中,他們各自的什麼含量成分比較大,同時進行相應的說明。

13.信度分析

這個方法是用在調查問卷中的,信度就是反應測量結果的一緻性和穩定性。在spss中的操作為“分析”--“度量”--“可靠性分析”

做一個例子分析:

spss快速學習(零基礎學習SPSS軟件)73

對上表的結果做一個信度分析:

spss快速學習(零基礎學習SPSS軟件)74

得到信度結果:

spss快速學習(零基礎學習SPSS軟件)75

cronbach“阿發”的系數為0.811,故該試卷的信度較好。從下面這個表,可以看出:

spss快速學習(零基礎學習SPSS軟件)76

有一個crobanch的系數值大于0.811,這個就表明:如果在試卷中删除名解的話,會提高試卷的信度值。

最後再講一個生存分析和Cox模型:

生存分析是把生存時間和生存結果綜合起來,對數據進行分析的一種統計方法。舉個栗子就懂了:(數據如下)

spss快速學習(零基礎學習SPSS軟件)77

spss快速學習(零基礎學習SPSS軟件)78

通過“分析”--“生存函數”--“壽命表”得到:

spss快速學習(零基礎學習SPSS軟件)79

spss快速學習(零基礎學習SPSS軟件)80

Cox模型:可以建立生存時間和危險因素之間的依存關系的模型。

命令:“分析”--“生存函數”--“COX回歸”

spss快速學習(零基礎學習SPSS軟件)81

spss快速學習(零基礎學習SPSS軟件)82

學完SPSS,對數據量化分析有了進一步的了解,SPSS不僅可以用在建模,也可以用在論文研究等領域,覺得ok就分享給身邊的同學吧!

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved