最小二乘法主要用來求解兩個具有線性相關關系的變量的回歸方程,該方法适用于求解與線性回歸方程相關的問題,如求解回歸直線方程,并應用其分析預報變量的取值等.破解此類問題的關鍵點如下:
①析數據,分析相關數據,求得相關系數r,或利用散點圖判斷兩變量之間是否存在線性相關關系,若呈非線性相關關系,則需要通過變量的變換轉化構造線性相關關系.
②建模型.根據題意确定兩個變量,結合數據分析的結果建立回歸模型.
③求參數.利用回歸直線y=bx a的斜率和截距的最小二乘估計公式,求出b,a,的值.從而确定線性回歸方程.
④求估值.将已知的解釋變量的值代入線性回歸方程y=bx a中,即可求得y的預測值.
注意:回歸直線方程的求解與應用中要注意兩個方面:一是求解回歸直線方程時,利用樣本點的中心(x,y)必在回歸直線上求解相關參數的值;二是回歸直線方程的應用,利用回歸直線方程求出的數值應是一個估計值,不是真實值.
經典例題:
下圖是某地區2000年至2016年環境基礎設施投資額(單位:億元)的折線圖.
為了預測該地區2018年的環境基礎設施投資額,建立了與時間變量的兩個線性回歸模型.根據2000年至2016年的數據(時間變量的值依次為1,2.,……,17)建立模型①:y=-30.4 13.5t;根據2010年至2016年的數據(時間變量的值依次為)建立模型②:y=99 17.5t.
(1)分别利用這兩個模型,求該地區2018年的環境基礎設施投資額的預測值;
(2)你認為用哪個模型得到的預測值更可靠?并說明理由.
思路分析:(1)兩個回歸直線方程中無參數,所以分别求自變量為2018時所對應的函數值,就得結果,(2)根據折線圖知2000到2009,與2010到2016是兩個有明顯區别的直線,且2010到2016的增幅明顯高于2000到2009,也高于模型1的增幅,因此所以用模型2更能較好得到2018的預測.
解析:(1)利用模型①,該地區2018年的環境基礎設施投資額的預測值為
=–30.4 13.5×19=226.1(億元).
利用模型②,該地區2018年的環境基礎設施投資額的預測值為
=99 17.5×9=256.5(億元).
(2)利用模型②得到的預測值更可靠.理由如下:
(i)從折線圖可以看出,2000年至2016年的數據對應的點沒有随機散布在直線y=–30.4 13.5t上下,這說明利用2000年至2016年的數據建立的線性模型①不能很好地描述環境基礎設施投資額的變化趨勢.2010年相對2009年的環境基礎設施投資額有明顯增加,2010年至2016年的數據對應的點位于一條直線的附近,這說明從2010年開始環境基礎設施投資額的變化規律呈線性增長趨勢,利用2010年至2016年的數據建立的線性模型=99 17.5t可以較好地描述2010年以後的環境基礎設施投資額的變化趨勢,因此利用模型②得到的預測值更可靠.
(ii)從計算結果看,相對于2016年的環境基礎設施投資額220億元,由模型①得到的預測值226.1億元的增幅明顯偏低,而利用模型②得到的預測值的增幅比較合理,說明利用模型②得到的預測值更可靠.
以上給出了2種理由,考生答出其中任意一種或其他合理理由均可得分.
總結:若已知回歸直線方程,則可以直接将數值代入求得特定要求下的預測值;若回歸直線方程有待定參數,則根據回歸直線方程恒過中心點求參數.
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!