tft每日頭條

 > 科技

 > 大數據挖掘第七章數據回歸方法

大數據挖掘第七章數據回歸方法

科技 更新时间:2024-12-04 10:17:34

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)1

鑒于多重線性回歸已經到了濫用的程度,特總結一下在使用線性回歸時需要注意的問題,總結為四大紀律加三項注意。

四大紀律

四大紀律之一:自變量與因變量之間要存在線性關系,可以通過繪制散點圖矩陣來考察,若不符合,需要進行變量的變換予以修正。

四大紀律之二:各個觀測值y1\y2\y3......要相互獨立,可通過殘差圖或durbin-watson檢驗予以考察。

四大紀律之三:殘差服從正态分布,可以通過标準化殘差圖考察

四大紀律之四:方差齊性,也可以通過标準化殘差考察

三項注意

三項注意之一:樣本量為自變量個數的5倍以上,要想效果好一些,最好20倍以上。

三項注意之二:判斷有誤強影響點,如有應該改正數據或者剔除或采用穩健回歸。

兩個自變量,21個樣本含量,符合20倍原則

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)2

繪制散點圖矩陣

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)3

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)4

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)5

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)6

從圖中可以看出,因變量與每個自變量都有線性關系

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)7

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)8

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)9

上圖分别檢查共線性,獨立性和異常點

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)10

做殘差圖,橫坐标為因變量,縱坐标為标準化殘差

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)11

調整r的平方越近與1,回歸效果越好,0.907效果不錯,durbin watson值在2左右說明殘差獨立性較好。

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)12

p=0.000小于0.05,線性回歸為顯著

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)13

回歸方程為y=-6.886 0.009人均支配收入 1.455人數,vif為方差膨脹因子一般隻要不超過10,認為不存在共線性

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)14

pp圖,點在直線附近分布,近似一條直線,說明殘差服從正态分布

大數據挖掘第七章數據回歸方法(多重線性回歸分析的四大紀律三項注意)15

殘差圖,三點在零的附近均勻分布,而且沒有超過正負3,認為殘差服從正态分布且方差齊,且沒有強影響點。

作者:楊老師

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved