因變量 y 的取值是不同的,y 取值的這種波動稱為變差。變差來源于兩個方面
由于自變量 x 的取值不同造成的
除 x 以外的其他因素(如x對y的非線性影響、測量誤差等)的影響
對一個具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差來表示
離差平方和的分解圖示
三個平方和的關系從上圖看有:
離差平方和的分解
兩端平方後求和有:
離差平方和的分解公式
三個平方和的意義總平方和(SST)
反映因變量的 n 個觀察值與其均值的總離差
回歸平方和(SSR)
反映自變量 x 的變化對因變量 y 取值變化的影響,或者說,是由于 x 與 y 之間的線性關系引起的 y 的取值變化,也稱為可解釋的平方和
殘差平方和(SSE)
反映除 x 以外的其他因素對 y 取值的影響,也稱為不可解釋的平方和或剩餘平方和
樣本決定系數(判定系數 r2 )回歸平方和占總離差平方和的比例
樣本決定系數
反映回歸直線的拟合程度
取值範圍在 [ 0 , 1 ] 之間
r2 —>1,說明回歸方程拟合的越好
r2—>0,說明回歸方程拟合的越差
判定系數等于相關系數的平方,即r2=(r)2
檢驗自變量和因變量之間的線性關系是否顯著
具體方法是将回歸離差平方和(SSR)同剩餘離差平方和(SSE)加以比較,應用F檢驗來分析二者之間的差别是否顯著
如果是顯著的,兩個變量之間存在線性關系
如果不顯著,兩個變量之間不存在線性關系
檢驗的步驟
回歸方程的顯著性檢驗
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!