tft每日頭條

 > 生活

 > 如何用spss做對應分析

如何用spss做對應分析

生活 更新时间:2024-11-30 20:49:18
序曲

白田馬上聞莺

李白(唐)

黃鹂啄紫椹,五月鳴桑枝。

我行不記日,誤作陽春時。

蠶老客未歸,白田已缫絲。

驅馬又前去,扪心空自悲。

【譯文】

黃鷗鳥啄食着柴色的桑椹,五月裡鳴叫在桑樹枝。

走啊走,我已不記得是什麼時日,誤以為現在還是陽春。

桑蠶已老,遊子尚未還歸,白田這地方已開始缫絲。

趨馬繼續前行,撫胸長歎空自悲歎。

【賞析】

這首詩寫的是初夏風景,文字通俗易懂,而構思上卻獨具匠心。

詩人選取了黃莺、桑樹、蠶三個日常生活中常見的意象,又把三者巧妙串連在一起,上承下啟,前呼後應,構成一個嚴謹有序的藝術整體。就在這幅通俗、淺顯的鄉土風情畫中,詩人寄托了他浪迹江湖、一事無成的悲哀。所謂“我行不記日,誤作陽春時”、“蠶老客未歸”,言下之意是陽春已過,初夏來臨,而自己大業未就,虛擲光陰,空度歲月。

正是桑間黃莺的啼鳴驚醒了詩人,時臨收獲的季節,應當珍惜年華,不能再作無目的漫遊了。但是,驅馬向前,扪心自問,前途是如此渺茫,令詩人倍感悲涼,尾聯收筆聯系深層的現實,而表達的情感正是一種懷才不遇、報國無門的思想情緒,其中也含有羁旅的愁苦以及對家鄉的思念之情

注:來源于 古詩文網

對應分析簡介什麼是對應分析?

對應分析(Correspondence analysis)也可稱為關聯分析、R-Q型因子分析,可看做是分析交叉表的一種方法,可以将交叉表中所包含的信息在低維的空間中進行降維投射,然後選取信息在其中最重要的兩條軸上的投射點,用圖形進行表示;能夠将幾組看不出任何聯系的數據,通過視覺上可以接受的定位圖展現出來。

對應分析法可以揭示同一變量的各個類别之間的差異,以及不同變量各個類别之間的對應關系。主要應用在市場細分、産品定位、地質研究以及計算機工程等領域中。

對應分析法整個處理過程由兩部分組成:表格和關聯圖。對應分析法中的表格是一個二維的表格,由行和列組成。每一行代表事物的一個屬性,依次排開。列則代表不同的事物本身,它由樣本集合構成,排列順序并沒有特别的要求。在關聯圖上,各個樣本都濃縮為一個點集合,而樣本的屬性變量在圖上同樣也是以點集合的形式顯示出來。

對應分析為我們可以提供三個方面的信息

  • 變量之間的信息
  • 樣本之間的信息
  • 變量與樣本之間的信息

上述三方面信息都可以通過二維圖呈現出來

  • 當對兩個分類變量進行的對應分析稱為簡單對應分析;
  • 對兩個以上的分類變量進行的對應分析稱為多重對應分析。

(2)基本思想

對應分析的基本思想就是将一個列聯表的行和列中各元素的比例結構以點的形式在較低維的空間中表示出來。(列聯表的每一行及每一列均以二維圖上的一個點來表示,以直觀、簡潔的形式描述屬性變量各種狀态之間的相互關系及不同屬性變量之間的相互關系。)

對應分析将變量及變量之間的聯系同時反映在一張二維或三維的散點圖上,并使聯系密切的類别點較集中,聯系疏遠的類别點較分散;通過觀察對應分布圖就能直觀地把握變量類别之間的聯系。

(3)分析步驟

對應分析法整個處理過程由兩部分組成:列聯表和關聯圖(行列變量分類的對應分布圖)。因此,對應分析大緻有四大步驟,分别為:

  • 編制交叉列聯表
  • 根據原始矩陣進行對應變換
  • 行變量和列變量的分類降維處理
  • 繪制行列變量分類的對應分布圖
SPSS實現對應分析

示例1:研究者收集了蘇格蘭北部5387名小學生眼睛與頭發顔色的數據,其中眼睛有深、棕、藍、淺4種顔色,頭發有金、紅、棕、黑、深5種顔色。研究者希望知道頭發和眼睛顔色間存在何種關聯,即某種頭發顔色的人其眼睛更傾向于何種顔色?

如何用spss做對應分析(SPSS對應分析)1

1. 參數說明
  • 打開 分析—降維—對應分析

如何用spss做對應分析(SPSS對應分析)2

(1)主頁面:定義行列變量及取值範圍

如何用spss做對應分析(SPSS對應分析)3

  • 行/列:選擇行/列變量,并确定取值範圍。
  • 最小值/最大值:輸入行/列變量的最小值與最大值,并點擊更新即可。
  • 類别的度—無:表示不再對分類值重新分組
  • 類别的度—類别必須相等:表示指定哪些分類值合并為一類
  • 類别的度—類别為補充值:表示指定某些分類不參與分析

(2)模型 選項框:

如何用spss做對應分析(SPSS對應分析)4

  • 解中的維數:輸入行列變量分類最終提取的因子個數,默認為2,表示各分類點顯示在二維平面上。
  • 距離測量:指定對應表的行和列之間距離的測量,對分類變量通常使用卡方,其他定距變量使用歐氏距離。
  • 标準化方法:指定數據的标準化處理方式。

除去行列平均值 :為默認值,在标準化時将行合計均數和列合計均數的影響均都移去,即行、列類别間均數的差異不再對結果産生影響。如:不同地區所有産品平均銷售額的不同不再納入分析,不同産品所有地區平均銷售額差異也不再納入分析,在結果中呈現的是行、列變量類别間的交互作用,諸如A産品銷量在各地都高于其他産品,或者上海地區的各種産品銷售額都高于其他地區這類信息均不進入分析。

删除行均值或删除列均值:在标準化時隻移除行或列變量合計均數差異的影響。以行變量為例,如果某一類别的均數與另一類别均數差始終為一常數,如A産品在各地的效率大約都比D産品高2萬,則該方法會将這種差異的影響消除。

使行總和相等删除均值或使列總和相等删除均值:在标準化時首先将原始數據除以行或列合計,然後再移除行或列均數差異影響。

  • 正态化方法:指定數據的正态化方式

對稱:重點分析行列變量各類别之間的聯系,而非每個變量各類别之間的差異

主要行:重點分析行變量各類别之間的差異

主要列:重點分析列變量各類别之間的差異

主要:希望同時分析行列變量各類别之間的差異

(3)統計 選項框:指定生成的數值輸出

  • 對應表:帶有行和列邊際總計的輸入變量的交叉表格。
  • 行點概覽:對于每個行類别,有得分、質量、慣量、對維慣量的貢獻,以及維對點慣量的貢獻。
  • 列點概覽: 對于每個列類别,有得分、質量、慣量、對維慣量的貢獻,以及維對點慣量的貢獻。
  • 行概要文件:對于每個行類别,為跨列變量類别的分布。
  • 列概要文件:對于每個列類别,為跨行變量類别的分布。
  • 對應表的排列:對應表重新組織為:行和列根據第一維上的得分按遞增順序排列。或者,可指定将為其生成置換表的最大維數。将為從 1 到指定數字的每一維分别生成一個置換表。
  • 行點的置信統計:包括所有非補充行點的标準差和相關性。
  • 列點的置信統計:包括所有非補充列點的标準差和相關性。

如何用spss做對應分析(SPSS對應分析)5

(4)圖 選項框:指定生成哪些圖

如何用spss做對應分析(SPSS對應分析)6

  • 散點圖:生成維的所有成對圖矩陣

雙标圖:生成行點和列點的聯合圖矩陣。如果選擇了主标準化,則雙标圖不可用。

行點:生成行點圖的矩陣。

列點:生成列點圖的矩陣。

  • 圖:為所選變量的每一維生成一個圖。可用的線圖包括:

已轉換的行類别:根據初始行類别值的對應行得分生成這些值的圖。

已轉換的列類别:根據初始列類别值的對應列得分生成這些值的圖。

  • 圖:可用以控制在輸出中顯示的維數。

顯示解中的所有維數:解中的所有維數都顯示在散點圖矩陣中。

限制維數:顯示的維數限制為繪制的對。如果限制維數,則必須選擇要繪制的最低和最高維數。最低維數的範圍可從 1 到解中的維數減 1,并且針對較高維數繪制。最高維數值的範圍可從 2 到解中的維數,表示要在繪制維對時使用的最高維數。此指定項适用于所有請求的多維圖。

2. 參數選擇
  • 數據加權:将num 進行加權
  • 将 hair 選入 行 列表框,單擊定義範圍,将數值範圍定義為1-5
  • 将 eye 選入 行 列表框,單擊定義範圍,将數值範圍定義為1-4
3. 結果分析
  • 版權信息:對應分析模塊是荷蘭Leiden大學DTTS課題組的研究成果。

如何用spss做對應分析(SPSS對應分析)7

  • 交叉列聯表:列聯表中的活動邊際為頻數合計

如何用spss做對應分析(SPSS對應分析)8

  • 摘要:在對應分析中,最多可提取的維度數等于兩變量的最小類别數-1,但往往前2-3個維度就攜帶了絕大多數信息,摘要表可給出所提取的每個維度(因子)所攜帶的信息量,從而幫助确定需要使用多少維度對結果進行解釋。

如何用spss做對應分析(SPSS對應分析)9

奇異值與慣量:奇異值的平方就是慣量,相當于因子分析彙總的特征根,用于說明對應分析各個維度結果能夠解釋列表中兩變量聯系的程度;所有維度慣量的綜合則仍然可以用來表示總信息量的大小。

卡方檢驗與p值:檢驗行變量與列變量間是否存在關聯,可以看作是對應分析适用條件的檢驗,隻有當行變量和列變量有關聯時,才需要使用對應分析對這種聯系加以分析。本例中卡方檢驗值為1240.039,p<0.05,所以拒絕零假設,認為行變量與列變量有顯著的相關關系。

方差解釋比例:表明每個維度所攜帶的信息量,實際上就是按照每個維度的慣量占總慣量的綜合比例計算而來。由表可知,第一維占總信息量的 0.199/0.23=86.6%,第二維占總信息量的13.1%,第三維占總信息量的0.4%。顯然,前兩個維度攜帶了絕大部分信息。

  • 行點總覽:行變量(頭發顔色)各類别的分析結果概況。給出各類别在各維度上的評分,以及相應的信息貢獻量兩大類信息。

如何用spss做對應分析(SPSS對應分析)10

數量Mass:實際上就是各類别的構成比,如發色為金色的共1455人,占總數比例為27%;比例的大小可近似地反映相應的指标是否穩定,因為比例越高,說明頻數越多,相應的分析結果就越不易受個别極端樣本的影響。

維得分:給出各類别在相關維度上的評分,首先給出的是在默認提出的兩個維度上各類别的因子負荷值(空間坐标值),随後的慣量列則給出了慣量在行變量中的分解情況,反映了總慣量(0.23)中分布由各行變量類别所提供的部分,數值越大,說明該類别對慣量的貢獻越大。

貢獻:首先給出在各維度上信息量在各類别間的分解情況。在本例中,第一維度的信息主要被金色、深色和黑色3個類别所攜帶,在第一維度區别較好;随後給出各類别的信息在各維度上的分布比例,如金色的總信息量中有90.7%分布在第一維度,隻有9.3%在第二維度。綜合觀察,除棕色外,絕大多數信息的都分布在第一維。最右側給出了各維度信息比例之和,可見紅色這一類别信息隻提取了80.3%的信息。

  • 列點總覽:列變量(眼睛顔色)各類别的分析結果概況。給出各類别在各維度上的評分,以及相應的信息貢獻量兩大類信息。與行點總覽分析相同

如何用spss做對應分析(SPSS對應分析)11

  • 對應分析圖

如何用spss做對應分析(SPSS對應分析)12

考察同一變量的區分度:首先分别考察行變量、列變量各類别間是否被清晰地分開了,可以分别檢查在各個維度上的區分情況,如果同一變量不同類别在某個方向哈桑靠的較近,則說明這些類别在該維度上區别不大。在本例中,可以看到無論是頭發顔色還是眼睛顔色在空間位置上分的比較開。

考察不同變量的類别這是對應分析的核心問題,一般而言,落在從圖形原點處出發相同方位上大緻相同區域内的不同變量的分類點彼此有聯系,散點間距離越近,說明關聯傾向約明顯;散點離原點越遠,也說明關聯傾向越明顯。

從上圖可看出,研究棕色與頭發棕色靠的比較近,顯然兩種特征之間存在關聯;眼睛深色和頭發黑色存在關聯;頭發金色和眼睛藍色、淺色存在聯系。

4. 語法

WEIGHT BY num. CORRESPONDENCE TABLE=hair(1 5) BY eye(1 4) /DIMENSIONS=2 /MEASURE=CHISQ /STANDARDIZE=RCMEAN /NORMALIZATION=SYMMETRICAL /PRINT=TABLE RPOINTS CPOINTS /PLOT=NDIM(1,MAX) BIPLOT(20).

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved