第二十六章回歸分析
[考情分析]
1、分值:2分
2、備考指導:本章節内容較少,内容相對難理解,注意理解一元線性回歸模型的含義,掌握最小二乘法的原理以及決定系數,理解回歸模型的檢驗。
3、考綱要求:
(1)理解回歸模型、回歸方程、回歸系數。
(2)掌握最小二乘法的原理和估計方法。
(3)根據估計的回歸方程進行回歸系數分析,掌握決定系數以及回
歸模型的檢驗。
一、回歸模型
(一)回歸分析的概念
1、回歸分析:指根據相關關系的具體形态,選擇一個合适的數學模型,來近似地表達變量間的依賴關系。
2、回歸分析和相關分析的關系
A聯系
(1)它們不僅具有共同的研究對象,而且在具體應用時,也必須互相補充。
(2)相關分析需要依靠回歸分析來表明現象數量相關的具體形式,而回歸分析則需要依靠相關分析來表明現象數量變化的相關程度。
(3)隻有當變量之間存在着高度相關時,進行回歸分析尋求其相關的具體形式才有意義。
B區别
(1)相關分析:
①研究變量之間相關的方向和相關的程度
②相關分析不能指出變量間相互關系的具體形式,也無法從一個變量的變化來推測另一個變量的變化情況。
(2)回歸分析:
研究變量之間相互關系的具體形式,對具有相關關系的變量之間的數量聯系進行測定,确定一個相關的數學方程式。根據這個數學方程式可以從已知出變量間相互關系量來推測未知量,從而為估算和預測提供了一個重要方法。
3、因變量:被預測或被解釋的變量,一般用Y表示
4、自變量:用來預測或解釋因變量的變量,一般用X表示。
[經典真題]
1、[2021]選擇合适的統計模型從一個變量的變化來推測另一個變量的變化情況,适用的統計方法是()。
A、散點圖
B、移動平均
C、相關系數
D、回歸分析
參考答案:D
參考解析:回歸分析則是研究變量之間相互關系的具體形式,它對具有相關關系的變量之間的數量聯系進行測定,确定一個相關的數學方程式,根據這個數學方程式可以從已知量來推測未知量,從而為估算和預測提供了一個重要的方法。
(二)一元線性回歸模型
根據自變量的多少分為:一元回歸模型和多元回歸模型。
根據是否是線性分為:線性回歸模型和韭線性回歸模型。
1、一元線性回歸模型:描述兩個變量之間相關關系的最簡單的回歸模型。回歸模型可以用描述因變量Y如何依賴自變量X和誤差項e的方程來表示。
2、隻涉及一個自變量的一元線性回歸模型可以表示為:Y=B0 p1X E
B0、B1一模型的參數。
(1)Y是X的線性函數(B0 B1X)加上誤差項E。
(2)B0 B1X反映了由于X的變化而引起的Y的線性變化。
(3)誤差項e是個随機變量,反映了除X和Y之間的線性關系之外的随機因素對Y的影響,是不能由X和Y之間的線性關系所解釋的Y的變異性。
3、描述因變量Y的期望E(Y)如何依賴自變量X的方程稱為回歸方程。一元線性回歸方程的形式為:E(Y)=B0 B1X
一元線性回歸方程的圖示是一條直線,B0是回歸直線的截距,B1是回歸直線的斜率,表示X每變動一個單位時,E(Y)的變動量。
二、最小二乘法
1、估計回歸方程:
2、原理:最小二乘法就是使得因變量的觀測值yi與估計值?i,之間的離差(又稱殘差)平方和最小來估計參數B0,和p1,的方法。根據最小二乘法,使得
[經典真題]
1、[2018]在回歸分析中,估計回歸系數的最小二乘法的原理是()
A、使得因變量觀測值與均值之間的離差平方和最小
B、使得因變量估計值與均值之間的離差平方和最小
C、使得觀測值與估計值之間的乘積最小
D、使得因變量觀測值與估計值之間的離差
平方和最小
參考答案:D
參考解析:最小二乘法就是使得因變量的觀測值與估計值之間的離差(又稱殘差)平方和最小來估計的方法。
三、模型的檢驗和預測
(一)回歸模型的拟合效果分析
1、模型的檢驗
一般情況下,在使用估計的回歸方程之前,需要對模型進行檢驗:
①結合經濟理論和經驗分析回歸系數的經濟含義是否合理;
②分析估計的模型對數據的拟合效果如何;
③對模型進行假設檢驗。
2、決定系數R²:也稱為拟合優度或判定系數,可以測度回歸模型對樣本數據的拟合程度。
決定系數是回歸模型所能解釋的因變量變化占因變量總變化的比例,取值範圍為[0,1]
(1)決定系數越高、模型的拟合效果就越好、即模型解釋因變量的能力越強。如果所有觀測點都落在回歸直線上,R²=1,說明回歸直線可以解釋因變量的所有變化。R²=0,說明回歸直線無法解釋因變量的變化,因變量的變化與自變量無關。
(2)現實應用中R²大多落在0和1之間,R²越接近于1,回歸模型的拟合效果越好;R²越接近于0,回歸模型的拟合效果越差。
2、回歸系數的顯著性檢驗
在大樣本假定的條件下,回歸系數的最小二乘估計量B0和B1,漸進服從正态分布,可以用t檢驗方法驗證自變量X對因變量Y是否有顯著影響。t檢驗的原理是反證法:在原假設B1=0(自變量X對因變量Y沒有影響)正确的假設下,基于^B1的抽樣分布計算一次抽樣情況下得到該樣本或更極端樣本的概率(P值),如果P<0.05,則可以在0.05的顯著性水平下拒絕原假設,認為自變量X對因變量Y有顯著性影響,即B1≠0
[經典真題]
1、[2021]回歸系數檢驗的目的是()
A、測算回歸模型的拟合效果
B、估計回歸系數的大小
C、檢驗自變量的經濟含義是否正确
D、檢驗自變量對因變量是否有顯著影響
參考答案:D
參考解析:回歸系數的顯著性檢驗主要是用來判斷回歸模型的自變量對因變量是否有顯著影響。
2、[2021]在回歸系數的顯著性檢驗中,如果P值=0.04,則()
A、在0.05的顯著性水平下接受原假設
B、在0.05的顯著性水平下拒絕原假設
C、原假設錯誤
D、原假設正确
參考答案:B
參考解析:如果P<0.05。則可以在0.05的顯著性水平下拒絕原假設,認為自變量X對因變量Y有顯著影響。
(二)模型預測
回歸分析的一個重要應用就是預測,即利用估計的回歸模型預估因變量數值。
(三)二元回歸模型案例
多元回歸模型在實際應用中,随着自變量個數的增加,即使在有些自變量與因變量完全不相關的情況下,決定系數R²也會增大。為避免因增加自變量個數而高估拟合效果的情況,多元回歸模型一般使用修正了自由度的調整後R²(Adjusted R Square)。調整後R²考慮了自變量個數增加帶來的影響,在數值上小于R²。
[經典真題]
1、[2021]關于回歸模型決定系數(R²)的說法,正确的有()
A、R越接近0,回歸模型的拟合效果越差
B、R²是回歸模型所能解釋的因變量變化占因變量總變化的比例
C、R²數值越大,回歸模型的拟合效果越好
D、R²的取值範圍是>0
E、自變量個數對R²沒有影響
參考答案:ABC
參考解析:決定系數是回歸模型所能解釋的因變量變化占因變量總變化的比例,取值範圍為[0,1]。決定系數越高,模型的拟合效果就越好,即模型解釋因變量的能力越強。ABC正确,D錯誤。多元回歸模型在實際應用中,随着自變量個數的增加,即使在有些自變量與因變量完全不相關的情況下,決定系數R²也會增大。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!