1、怎樣的拟合直線最好?——與所有點都近,即與所有點的距離之和最小。
最小二乘法可以幫助我們在進行線性拟合時,如何選擇“最好”的直線。要注意的是,利用實驗數據進行拟合時,所用數據的多少直接影響拟合的結果,從理論上說,數據越多,效果越好,即所估計的直線方程越能更好地反映變量之間的關系。一般地,我們可以先作出樣本點的散點圖,确認線性相關性,然後再根據回歸直線系數的計算公式進行計算。
2、刻畫樣本點
與直線y=a bx之間的“距離”——
思考:①這個“距離”與點到直線的距離有什麼關系?
很顯然,這個式值越小,則樣本點與直線間的距離越小。
②為什麼不直接利用點到直線的距離來刻畫樣本點與直線之間的距離關系?
3、最小二乘法
如果有n個點:(x1,y1),(x2,y2),(x3,y3),……,(xn,yn),我們用下面的表達式來刻畫這些點與直線y=a bx的接近程度:
。
使得上式達到最小值的直線y=a bx就是我們所要求解的直線,這種方法稱為最小二乘法。
4、線性回歸方程
,其中
這個直線方程稱為線性回歸方程,a,b是線性回歸方程的系數(回歸系數)。
例1、推導2個樣本點的線性回歸方程
設有兩個點A(x1,y1),B(x2,y2),用最小二乘法推導其線性回歸方程并進行分析。
解:由最小二乘法,設
,則樣本點到該直線的“距離之和”為
從而可知:當
時,b有最小值。将
代入“距離和”計算式中,視其為關于b的二次函數,再用配方法,可知:
此時直線方程為:
設AB中點為M
,則上述線性回歸方程為
可以看出,由兩個樣本點推導的線性回歸方程即為過這兩點的直線方程。這和我們的認識是一緻的:對兩個樣本點,最好的拟合直線就是過這兩點的直線。
用最小二乘法對有兩個樣本點的線性回歸直線方程進行了直接推導,主要是分别對關于a和b的二次函數進行研究,由配方法求其最值及所需條件。實際上,由線性回歸系數計算公式:
可得到線性回歸方程為
設AB中點為M
,則上述線性回歸方程為
。
例2、求回歸直線方程
在硝酸鈉的溶解試驗中,測得在不同溫度
下,溶解于100份水中的硝酸鈉份數
的數據如下
|
0 |
4 |
10 |
15 |
21 |
29 |
36 |
51 |
68 |
|
66.7 |
71.0 |
76.3 |
80.6 |
85.7 |
92.9 |
99.4 |
113.6 |
125.1 |
描出散點圖并求其回歸直線方程.
解:建立坐标系,繪出散點圖如下:
由散點圖可以看出:兩組數據呈線性相關性。設回歸直線方程為:
由回歸系數計算公式:
可求得:b=0.87,a=67.52,從而回歸直線方程為:y=0.87x 67.52。
例3、綜合應用
假設關于某設備的使用年限x和所支出的維修費用y(萬元)有如下統計資料:
(1)求回歸直線方程;(2)估計使用10年時,維修費用約是多少?
解:(1)設回歸直線方程為:
(2)将x = 10代入回歸直線方程可得y = 12.38,即使用10年時的維修費用大約是12.38萬元。
--END--
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!