在研究X對Y的影響時,因變量Y有時是分類變量,這時如果還想分析影響關系可以使用logit回歸,常見的logit回歸包括,二元logit回歸(二項logit回歸)、多分類logit回歸以及有序logit回歸。三者的區别如下:
此案例使用多分類logit回歸研究幸福感情況。
一、案例背景
某研究者分别于1985年、1995年、2005年調查了已婚及未婚的30歲左右成年人的幸福感情況,部分數據如下,有時“幸福感”也會看成是有序變量,如果看成有序變量,該案例可以進行“有序logit”,該案例将“幸福感”看成多分類變量。所以用多分類logit分析。
該研究以“幸福感”為因變量,“婚姻狀況”和“年份”為自變量建立模型,觀察模型影響因素
二、分析前處理
對于自變量,該案例認為“婚姻狀況”、“年份”為定類變量所以将二者進行啞變量處理。
補充說明:
多分類logit因變量為類别數據,研究X對Y的影響時,如果為類别數據,那麼不能說越如何越如何,這就是類别數據的特點,一定是相對某某而言。這就導緻了多分類logistic回歸分析時,文字分析的難度加大,如果說因變量Y的類别個數很多,比如為10個,此時建議時對類别進行組合下,盡量少的減少類别數量,便于後續進行分析。此步驟可通過SPSSAU數據處理模塊的數據編碼功能完成。該案例的類别隻有三個所以不進行處理。
三、結果分析
結果将從四個方面進行說明,其中包括“基本彙總”、“模型似然比檢驗”、“模型公式及影響關系”以及“模型預測效果分析”。
1、基本彙總
從上表可以看出共有5375個樣本參與分析,其中比較幸福的成年人占比較大,占總分析人數的56.19%,不太幸福的成年人占比最少,占總分析人數的11.29%,接下來對模型似然比檢驗進行查看。
2、模型似然比檢驗
首先對p值進行分析,如果該值小于0.05,則說明模型有效;反之則說明模型無效,從上表可以看出p值小于0.05,說明拒絕原定假設,即說明本次構建模型時,放入的自變量具有有效性,本次模型構建有意義。接下來構建模型以及分析影響因素。
3、模型公式及影響關系
該案例的參考項是“不太幸福”,并且因為對自變量婚姻情況和年份進行啞變量處理,所以放入的自變量分别為‘婚姻狀況_未婚’‘年份_1995年’以及‘年份_2005年’。有上表可以得到模型公式。
說明如下:
ln(十分幸福/不太幸福)=0.087 1.737*婚姻狀況_未婚-0.110*年份_1995.0 0.115*年份_2005.0
ln(比較幸福/不太幸福)=1.375 0.796*婚姻狀況_未婚-0.382*年份_1995.0-0.134*年份_2005.0
影響關系具體分析如下:
(1)“十分幸福”和“不太幸福”進行比較
相對于不太幸福來講,在十分幸福的前提之下,婚姻情況為未婚的回歸系數為正并且p值<0.05,未婚會對幸福感産生顯著的正向影響關系。也就是相對于“幸福感”來講,未婚成年人比已婚成年人會幸福。
(2)“比較幸福”和“不太幸福”進行比較
相對于不太幸福來講,在比較幸福的前提之下,婚姻情況為未婚的回歸系數為正并且p值<0.05,所以未婚會對幸福感産生顯著的正向影響關系。也就是相對于“幸福感”來講,未婚成年人比已婚成年人比較幸福。并且分析項1995年的p值<0.05并且回歸系數為-0.382<0,所以相對于1985年調查的成年人不太幸福。
模型預測效果分析
通過模型預測準确率去判斷模型拟合質量,從上表可知:研究模型的整體預測準确率為56.19 %,模型拟合情況一般。該案例分析模型預測不是重點,如正常分析可以忽略。
四、總結
案例利用多分類logit回歸分析方法,以“幸福感”為因變量,“婚姻狀況”和“年份”為自變量建立模型,觀察模型影響因素。在分析前對自變量進行處理以及對結果進行分析,其中包括基本彙總、模型似然比檢驗、模型公式及影響關系以及模型預測效果分析,該案例分析模型預測不是重點,如正常分析可以忽略。最後發現就是相對于“幸福感”來講,未婚成年人比已婚成年人會幸福。1985年調查成年人比1995年調查的成年人更幸福。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!