鑒于多重線性回歸已經到了濫用的程度,特總結一下在使用線性回歸時需要注意的問題,總結為四大紀律加三項注意。
四大紀律
四大紀律之一:自變量與因變量之間要存在線性關系,可以通過繪制散點圖矩陣來考察,若不符合,需要進行變量的變換予以修正。
四大紀律之二:各個觀測值y1\y2\y3......要相互獨立,可通過殘差圖或durbin-watson檢驗予以考察。
四大紀律之三:殘差服從正态分布,可以通過标準化殘差圖考察
四大紀律之四:方差齊性,也可以通過标準化殘差考察
三項注意
三項注意之一:樣本量為自變量個數的5倍以上,要想效果好一些,最好20倍以上。
三項注意之二:判斷有誤強影響點,如有應該改正數據或者剔除或采用穩健回歸。
兩個自變量,21個樣本含量,符合20倍原則
繪制散點圖矩陣
從圖中可以看出,因變量與每個自變量都有線性關系
上圖分别檢查共線性,獨立性和異常點
做殘差圖,橫坐标為因變量,縱坐标為标準化殘差
調整r的平方越近與1,回歸效果越好,0.907效果不錯,durbin watson值在2左右說明殘差獨立性較好。
p=0.000小于0.05,線性回歸為顯著
回歸方程為y=-6.886 0.009人均支配收入 1.455人數,vif為方差膨脹因子一般隻要不超過10,認為不存在共線性
pp圖,點在直線附近分布,近似一條直線,說明殘差服從正态分布
殘差圖,三點在零的附近均勻分布,而且沒有超過正負3,認為殘差服從正态分布且方差齊,且沒有強影響點。
作者:楊老師
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!