stata如何做多元線性回歸模型-tft每日頭條

stata如何做多元線性回歸模型

生活更新时间:2025-04-28 08:57:49

回歸分為解釋性回歸和預測性回歸

預測型回歸對預測精度要求較高，可以在模型中添加平方項和交互項甚至高次項進行改進模型，不一定隻有線性項

但是加入的自變量如果過多，比如4個變量，再加上他們的平方項，8個變量對于小樣本的話很容易出現過拟合，和NN很像，對這些樣本的表示已經特别完備了，預測能力很好，但是對于樣本外的數據預測效果很差。

stata如何做多元線性回歸模型（多元線性回歸stata）1

因變量如果是0-1變量則為0-1回歸

回歸的思想，任務，使命，分類

stata如何做多元線性回歸模型（多元線性回歸stata）2

因變量y可以分為

stata如何做多元線性回歸模型（多元線性回歸stata）3

所以回歸可以分類為

stata如何做多元線性回歸模型（多元線性回歸stata）4

下面這個0-1回歸的例子中的因變量自變量都是0-1變量

stata如何做多元線性回歸模型（多元線性回歸stata）5

stata如何做多元線性回歸模型（多元線性回歸stata）6

stata如何做多元線性回歸模型（多元線性回歸stata）7

stata如何做多元線性回歸模型（多元線性回歸stata）8

stata如何做多元線性回歸模型（多元線性回歸stata）9

回歸就是拟合的後續回歸就是拟合的後續回歸就是拟合的後續

但是多元線性回歸指定了函數形式是多元線性函數，拟合的時候不能随便采用别的多項式函數或其他自定義函數

用最小二乘法計算出公式（函數的形式可以由經驗、先驗知識或對數據的直觀觀察決定，或者直接使用多項式）裡的系數，拟合就完成了，但是回歸的工作還沒有結束，還需要去研究這些系數（這個公式）的可信度，每個系數對因變量的影響，因為回歸分析認為真正的拟合系數應該是一個随機變量而非确值，拟合用最小二乘求出來的這些系數隻是對真正系數的一個點估計，所以有必要繼續去研究區間估計或者假設檢驗。總之，拟合隻是求出一條曲線能反映數據的趨勢就行了，但是回歸的要求是更高的更精确的。

對拟合得到的系數進行進一步估計和檢驗

stata如何做多元線性回歸模型（多元線性回歸stata）10

stata如何做多元線性回歸模型（多元線性回歸stata）11

stata如何做多元線性回歸模型（多元線性回歸stata）12

stata如何做多元線性回歸模型（多元線性回歸stata）13

stata如何做多元線性回歸模型（多元線性回歸stata）14

解釋y的形成機制就是通過建立x，y的數學關系式

stata如何做多元線性回歸模型（多元線性回歸stata）15

感覺相關分析就是回歸分析的前兩步，但是使用的方法不是通過相關

逐步回歸後面講，篩選最有效的幾個變量，剔除不重要的變量，簡化回歸模型

stata如何做多元線性回歸模型（多元線性回歸stata）16

線性回歸一定隻能用于有線性關系的變量嗎

首先必須明确，多元線性回歸中的“線性”是一個假定。是需要去檢驗的！

stata如何做多元線性回歸模型（多元線性回歸stata）17

stata如何做多元線性回歸模型（多元線性回歸stata）18

非線性關系，如對數關系也是可以用線性回歸的，隻要先化成這個形式

數據的預處理主要是注意異常值，異常值，離群點對回歸模型的影響是非常大的

stata如何做多元線性回歸模型（多元線性回歸stata）19

可以在excel中求出變量的對數項，平方項，交互項（x1*x2），然後用spss畫散點圖看看有沒有線性關系

stata如何做多元線性回歸模型（多元線性回歸stata）20

stata如何做多元線性回歸模型（多元線性回歸stata）21

stata如何做多元線性回歸模型（多元線性回歸stata）22

數據的分類

stata如何做多元線性回歸模型（多元線性回歸stata）23

stata如何做多元線性回歸模型（多元線性回歸stata）24

stata如何做多元線性回歸模型（多元線性回歸stata）25

stata如何做多元線性回歸模型（多元線性回歸stata）26

stata如何做多元線性回歸模型（多元線性回歸stata）27

用回歸找出所有指标中最重要的幾個

那麼受到啟發的我們就可以用回歸去找和患某病最相關的基因位點（2016年研究生國賽B題）

stata如何做多元線性回歸模型（多元線性回歸stata）28

數據的标準化處理

不管幹啥，主成分分析啦，回歸啦，要想消除量綱的影響，就要對數據進行标準化處理，這算數據預處理的内容

stata如何做多元線性回歸模型（多元線性回歸stata）29

最小二乘法拟合一元線性回歸方程的幾個結論

stata如何做多元線性回歸模型（多元線性回歸stata）30

stata如何做多元線性回歸模型（多元線性回歸stata）31

回歸系數的解釋

stata如何做多元線性回歸模型（多元線性回歸stata）32

stata如何做多元線性回歸模型（多元線性回歸stata）33

多元線性回歸模型中的回歸系數

stata如何做多元線性回歸模型（多元線性回歸stata）34

stata如何做多元線性回歸模型（多元線性回歸stata）35

遺漏變量會造成内生性（擾動項和變量相關）

多元線性回歸一定要避免内生性，使得模型具有外生性

所以如果要使用多元線性回歸，是一定要檢驗模型是否具有外生性的，這可以通過檢驗每一元變量和擾動項的相關系數

stata如何做多元線性回歸模型（多元線性回歸stata）36

弱化完全無内生性的條件

stata如何做多元線性回歸模型（多元線性回歸stata）37

虛拟變量

虛拟變量對于有定性變量的問題是非常重要的，很多現實問題都有定性變量，并且定性變量一般還比定量變量多呢

有的時候讓你研究工資的高低是否和性别有關，貸款申請成功與否是否和申請人所處地域有關，你一般隻能想到做相關性分析，算相關系數啥的，但是其實也可以通過設置虛拟變量進行回歸分析，獲得更準确的公式表達，從另一個角度解決問題

虛拟變量是0-1變量，指示變量

既然主要探究的就是性别和地域分别對于工資和貸款申請成功率的影響，那麼這兩個因素在各自的模型裡就是核心解釋變量，其他變量都是控制變量

虛拟變量的回歸系數表示的是其他因素相同且一定的情況下，由虛拟變量帶來的對y的影響/變化，即虛拟變量兩種取值的差異程度，如女性工資和男性工資的平均差異

stata如何做多元線性回歸模型（多元線性回歸stata）38

stata如何做多元線性回歸模型（多元線性回歸stata）39

虛拟變量的數目是分類數-1

stata如何做多元線性回歸模型（多元線性回歸stata）40

下圖中的定性變量都是要用虛拟變量建模的，在stata中也可以用代碼生成虛拟變量

stata如何做多元線性回歸模型（多元線性回歸stata）41

stata如何做多元線性回歸模型（多元線性回歸stata）42

stata示例

stata如何做多元線性回歸模型（多元線性回歸stata）43

stata如何做多元線性回歸模型（多元線性回歸stata）44

自變量還有這種複雜形式的關系，随着x1的增大，y随x2增大的更多，即y跟x2的關系不是獨立于x1的

stata如何做多元線性回歸模型（多元線性回歸stata）45

怎麼評估回歸質量/拟合效果分析——判定系數（拟合優度）

通過評估殘差的樣本标準差或者樣本方差，進行方差分析，越小則回歸模型的解釋性越好，精度越高

最小二乘拟合的求解決定了殘差和必須是0，所以殘差的樣本均值也是0

由于有兩個限制條件，所以殘差平方和自由度少了2個，即當有n-2個殘差已知時，另外2個也就确定了。

這裡樣本方差是除以n-2,不是n-1，更不是n，也一樣是為了保證樣本方差是總體方差的無偏估計。

stata如何做多元線性回歸模型（多元線性回歸stata）46

我們用樣本方差度量樣本的變異程度

stata如何做多元線性回歸模型（多元線性回歸stata）47

stata如何做多元線性回歸模型（多元線性回歸stata）48

判定系數

stata如何做多元線性回歸模型（多元線性回歸stata）49

stata如何做多元線性回歸模型（多元線性回歸stata）50

調整的拟合優度（引入自變量的個數到判定系數的計算中）

調整後的拟合優度更有參考意義

stata如何做多元線性回歸模型（多元線性回歸stata）51

擾動項必須是“同方差”和“無自相關”的球型擾動項

stata如何做多元線性回歸模型（多元線性回歸stata）52

穩健标準誤處理數據異方差

一般數據都是異方差的，這時候用最小二乘估計的回歸系數是不可靠的，針對他們的假設檢驗也不可靠，我們可以用穩健标準誤解決

數據定量的指标已經在excel中标準化了

stata如何做多元線性回歸模型（多元線性回歸stata）53

在stata中把定性變量設置為虛拟變量，然後直接多元線性回歸

stata如何做多元線性回歸模型（多元線性回歸stata）54

stata如何做多元線性回歸模型（多元線性回歸stata）55

stata如何做多元線性回歸模型（多元線性回歸stata）56

所以可以寫出回歸方程

高考總分 = − 0.0024 ∗ A 1 0.1186 ∗ 平時成績 − 0.1287 ∗ 期末成績 0.0368 ∗ 高考數學 0.9246 高考總分=-0.0024*A1 0.1186*平時成績-0.1287*期末成績 0.0368*高考數學 0.9246高考總分=−0.0024∗A1 0.1186∗平時成績−0.1287∗期末成績 0.0368∗高考數學 0.9246

根據後面的解讀可以知道，這個結果的F值不大，回歸結果并不好，從最後的回歸結果看，期末成績竟然和高考總分負相關了，肯定不對

stata回歸結果解讀

（model,SS）是回歸平方和SSR(RESIDUAL,ss)是剩餘平方和SSE（total,ss）是SST，等于SSR SSE

stata如何做多元線性回歸模型（多元線性回歸stata）57

stata如何做多元線性回歸模型（多元線性回歸stata）58

stata如何做多元線性回歸模型（多元線性回歸stata）59

stata如何做多元線性回歸模型（多元線性回歸stata）60

最關鍵的回歸結果，即回歸系數在第一列，後面還給了每個系數的标準差（越小越好），t檢驗值，t檢驗的p值（越小說明這個系數越顯著不為0），以及置信區間

stata如何做多元線性回歸模型（多元線性回歸stata）61

上圖上面的紅框，一個定性變量的n個虛拟變量（n為這個定性變量的取值總類數），有一個會因為多重共線性被stata自動檢測到并忽略，這是因為我們本類就隻需要設置n-1個虛拟變量，上面也講來的

右邊的F值越大，prob越小，則表示所有系數的聯合顯著性越大，即所有變量都為0的概率很低SSE

stata如何做多元線性回歸模型（多元線性回歸stata）62

obs，觀測數目，即樣本總數

stata如何做多元線性回歸模型（多元線性回歸stata）63

stata如何做多元線性回歸模型（多元線性回歸stata）64

stata如何做多元線性回歸模型（多元線性回歸stata）65

異方差是什麼，怎麼檢驗和處理

回歸結束後一定要見檢驗異方差，也算檢驗回歸結果

stata如何做多元線性回歸模型（多元線性回歸stata）66

stata如何做多元線性回歸模型（多元線性回歸stata）67

stata如何做多元線性回歸模型（多元線性回歸stata）68

stata如何做多元線性回歸模型（多元線性回歸stata）69

stata如何做多元線性回歸模型（多元線性回歸stata）70

stata如何做多元線性回歸模型（多元線性回歸stata）71

用殘差的平方表示随機誤差項的方差

stata如何做多元線性回歸模型（多元線性回歸stata）72

有六兩種圖示檢驗法檢驗異方差

一是用每個解釋變量和被解釋變量的散點圖看

stata如何做多元線性回歸模型（多元線性回歸stata）73

而是解釋變量和殘差平方的圖像

stata如何做多元線性回歸模型（多元線性回歸stata）74

所以畫這個散點圖

stata如何做多元線性回歸模型（多元線性回歸stata）75

bp檢驗

原假設是同方差

stata如何做多元線性回歸模型（多元線性回歸stata）76

原假設：擾動項不存在異方差P值大于0.05，說明在95%的置信水平下接受原假設，即我們認為擾動項不存在異方差。

這大概就是為啥上面加了robust得到的回歸結果相同的理由了，因為不存在異方差

stata如何做多元線性回歸模型（多元線性回歸stata）77

懷特檢驗原假設：不存在異方差

結果p大于0.05，接受原假設，不存在異方差

這個例子就是有異方差的咯

stata如何做多元線性回歸模型（多元線性回歸stata）78

畫出回歸的殘差

stata如何做多元線性回歸模型（多元線性回歸stata）79

stata如何做多元線性回歸模型（多元線性回歸stata）80

多重共線性的表現

stata如何做多元線性回歸模型（多元線性回歸stata）81

梳理橫截面數據的回歸步驟

這裡隻研究截面數據的多元回歸

excel數據導入stata會自動認為是截面數據

先檢驗各個自變量的相關性（更好地做法是，一上來先把所有變量都放在回歸模型中，然後觀察結果，然後再檢驗自變量的相關性，根據相關性剔除一些變量再次回歸查看結果）

所有回歸必須用robust

stata如何做多元線性回歸模型（多元線性回歸stata）82

stata如何做多元線性回歸模型（多元線性回歸stata）83

stata如何做多元線性回歸模型（多元線性回歸stata）84

stata如何做多元線性回歸模型（多元線性回歸stata）85

stata如何做多元線性回歸模型（多元線性回歸stata）86

發現house和car有相關性以後，就剔除了car變量，再次回歸得到的F值變大了

stata如何做多元線性回歸模型（多元線性回歸stata）87

多重共線性檢驗

stata如何做多元線性回歸模型（多元線性回歸stata）88

stata如何做多元線性回歸模型（多元線性回歸stata）89

stata如何做多元線性回歸模型（多元線性回歸stata）90

stata如何做多元線性回歸模型（多元線性回歸stata）91

逐步回歸向前逐步回歸

stata如何做多元線性回歸模型（多元線性回歸stata）92

向後逐步回歸

stata如何做多元線性回歸模型（多元線性回歸stata）93

比較

所有變量一起回歸，隻有部分結果

stata如何做多元線性回歸模型（多元線性回歸stata）94

方差膨脹系數，說明有明顯的多重共線性

stata如何做多元線性回歸模型（多元線性回歸stata）95

向後

stata如何做多元線性回歸模型（多元線性回歸stata）96

stata如何做多元線性回歸模型（多元線性回歸stata）97

向前

stata如何做多元線性回歸模型（多元線性回歸stata）98

stata如何做多元線性回歸模型（多元線性回歸stata）99

可以看到，向前回歸得到了22個變量，向後得到了21個變量，向後逐步回歸的F值最大，向前和向後的方差膨脹系數幾乎相等，所以對多重共線性的解決是不錯的，二者的判定系數也幾乎一樣。

基本上剔除的變量都是地域的分類變量，說明多重共線性也主要是他們引起的

代碼：

stata如何做多元線性回歸模型（多元線性回歸stata）100

stata如何做多元線性回歸模型（多元線性回歸stata）101

注：以上學習材料整理均源于網絡，如有侵權，請聯系删除。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活朱砂根的養殖方法
1、溫度：由于它原産的地區是在亞熱帶附近，所以它對溫度要求較高。平時最好保持在十八至三十度之間。它對... 2023-07-09
生活洗潔精可以洗臉嗎
1、洗潔精是不可以洗臉的。因為洗潔精含有堿性用品，如果用于洗臉，那麼很容易造成臉部角質層損傷，嚴重的... 2023-07-09
生活吃橘子的好處和壞處
1、吃橘子的好處：（1）潤肺化痰橘子是具有祛痰、止咳、平喘、潤肺、開胃理氣等功效的，對咳嗽伴有喉嚨痛... 2023-07-09
生活校園環保标語
1、保護環境，少說多做，讓校園成為綠色的殿堂。2、少一個腳印，多一個生命。3、手下留情花更豔，腳下留... 2023-07-09
生活複合肥和複合肥料有什麼區别
1、養分含量：複合肥養分含量比較固定，常見的氮磷鉀比例各為15%，而複混肥料它的養分含量有三個檔位，... 2023-07-09
生活騰訊微博注銷方法
1、首先登陸騰訊微博網頁版，筆者一般直接從qq客戶登陸比較方便，打開qq，點擊面闆上的微博圖标進入即... 2023-07-09
生活多多買菜供應商如何入駐
1、自有門店，皆可入駐如今拼多多已經推出了多多買菜，隻要你有自己有門店，皆可入駐。目前門店入駐免費，... 2023-07-09
生活茄子為什麼不能用尿素
1、尿素屬于氮肥,其濃度比較高,過量使用會造成肥害,所以茄子不能用尿素,可以用其他肥料代替。茄子需氮... 2023-07-09
生活英語幸福句子
1、如果可以，請把我留在童年裡，留在青春裡，留在最好的時光裡。Ifyoucan,pleaseleav... 2023-07-09
生活牛年本命年忌紅色嗎
1、牛年本命年不忌紅色，本命年是可以穿紅色衣服的。2、對于本命年犯太歲的人來說，新年有穿紅、戴紅的習... 2023-07-09
生活怎麼才能知道一個人手機上有兩個微信？
1、首先，從眼見為實來講：一個人如果多個微信号，在手機上面會有記錄，如果能接觸到，就有辦法了。一般接... 2023-07-09
生活玉米粒釣鯉魚制作方法
1、首先需要先将玉米粒掐掉根部，使其剛好冒漿，但要保留好玉米臍，用手用力捏住玉米粒邊緣，一手将鈎尖從... 2023-07-09
生活手機裡的軟件老是自動更新怎麼辦
1、對ios系統來說，解決辦法如下：找到“設置”，點擊進入；進入界面以後，下滑找到“iTunes與A... 2023-07-09
生活火災遇險自救方法有哪些
1、受到火勢威脅時，要當機立斷，披上浸濕的衣物、被褥等向安全出口方向沖出去。2、防煙堵火：這是非常關... 2023-07-09
生活烘焙模具的種類有哪些
1、烘焙模具有方形的蛋糕模和圓形的蛋糕模還有活動的蛋糕模和慕斯蛋糕模具，這些模具多是鐵質的較多。2、... 2023-07-09
生活天水三陽川現代名人
1、裴新華：1972年12月5日出生甘肅天水，中醫世家，1994年畢業于中國傳媒大學播音系，畢業後擔... 2023-07-09
生活簡約創意昵稱
1、哆啦C夢，旖旎，淺時光，此昵稱不存在，習慣不習慣的習慣，隻為博尓傾城一笑，我用堅強找到我旳驕傲，... 2023-07-09
生活學中醫護理能幹什麼
1、醫師。國家的農村、社區醫療事業逐漸發展起來，可以考慮在一些社區、街道醫院或基層醫療工作單位做全科... 2023-07-09
生活野釣鲫魚教程
1、釣點的選擇：釣點的選擇需要根據釣法來選擇，台釣和傳統釣肯定是有區别的。以傳統釣為例，晚春時節天氣... 2023-07-09
生活槽罐車和油罐車區别
1、沒區别。其實槽罐車就是油罐車，是同一類車型的不同稱謂，都是罐式危險品運輸車輛，用來運輸不可洩漏的... 2023-07-09
生活獨特的生日禮物有哪些
1、生肖紀念币每個人的生日都是很特别的，所以送生肖紀念币也是很有意義的，感覺非常的獨特，而且很有收藏... 2023-07-09
生活在大霧中行走怎樣避免危險
1、正确使用燈光霧天行車應及時打開霧燈、示廓燈或近光燈，如果在高速路上行駛或者霧很濃的情況下還要打開... 2023-07-09
生活三甲軟堅粉
1、鼈甲(醋炒)300克，龜闆(酥炙)200克，穿山甲(砂炒)100克，白糖或蜂蜜适量。2、三藥烘幹... 2023-07-09
生活枸杞盆景的養殖方法和注意事項
1、土壤：盆景栽植對土壤的需求很高，其一般适合養殖在排水性能比較好的土質中，沙質土壤就是最佳選擇。2... 2023-07-09
生活華為手機如何強制關機
1、長按手機電源鍵3秒，此時手機會出現新界面，此時松開電源鍵，點擊其中的“重啟”即可。2、有些時候，... 2023-07-09
生活人生語錄短句霸氣
1、趁青春沒有逝去，做自己想做的，說自己想說的，不要讓青春留有我們的遺憾。2、如果那時沒有遇見你，可... 2023-07-09
生活道路自信的含義
1、道路自信：道路自信源自于道路開辟、道路創新和道路自覺，需要大家進一步堅持和拓展中國特色社會主義道... 2023-07-09
生活攝影對角布局技巧
1、對角線構圖：對角線構圖是一種導向性很強的構圖方式，它将主體安排在對角線上，能有效利用畫面對角線的... 2023-07-09
生活眉毛的生長周期有多久
1、眉毛生長期一般就是兩個月左右，而休止期能夠達到九個月，然後就會自行的脫落，毛發生長的速度受多方面... 2023-07-09
生活事業單位行業分類
1、事業單位的崗位設置根據不同的角度劃分出不同的崗位。2、事業單位崗位設置的原則是：科學合理、精簡效... 2023-07-09

tft每日頭條

> 生活

> stata如何做多元線性回歸模型

stata如何做多元線性回歸模型

相关生活资讯推荐

热门生活资讯推荐

网友关注