在許多實際問題分析中,回歸分析的應用十分廣泛,它是處理變量之間相關關系最常用的一種統計方法。回歸分析可分為線性回歸和非線性回歸。
線性回歸分析相信大家都已經非常熟悉了,它主要分析有線性回歸趨勢的兩個變量間的關系。
但是在處理許多實際問題時,變量間的關系并非直線關系,例如細菌生長曲線、藥物動力學、毒物劑量與動物死亡率的關系等等。此時,若采用線性回歸分析将丢失大量信息,甚至得出錯誤結論。因此,就需要我們采用非線性回歸模型來處理此類問題。
非線性回歸有多種形式,包括雙曲線、二次曲線、三次曲線、幂函數曲線、指數函數曲線、S形曲線、對數曲線、指數曲線等。
非線性回歸分析的關鍵是确定函數的具體形式。通常需要根據科學研究或生産實際中的具體問題或試驗數據的特征做出合适的選擇。
下面小編将向大家介紹如何用R軟件實現非線性回歸中的多項式回歸。
實例:某種合金中的主要成分為元素A和B,試驗發現這兩種元素之和x與合金膨脹系數y之間有一定的數量關系。試根據表給出的試驗數據找出y與x之間的回歸關系。
多項式回歸分析的步驟:
首先,确定變量間的關系函數
當變量間的關系函數為多項式方程時,可進行多項式回歸分析。
多項式方程是指若在一次方程中引入x的二次、三次,甚至是更高次項,直線方程就成為一般多項式方程,如為某曲線型數據拟合多項式函數:
y=b0 b1x b2x^2 …bpx^p
根據試驗數據,畫出散點圖,觀察兩者之間的關系。
#輸入數據 x<-c(37.0,37.5,38.0,38.5,39.0,39.5,40.0,40.5,41.0,41.5,42.0,42.5,43.0) y<-c(3.40,3.00,3.00,2.27,2.10,1.83,1.53,1.70,1.80,1.90,2.35,2.54,2.90) alloy.data<-data.frame(x,y)#将數據形成數據框 plot(y~x,data = alloy.data)#畫散點圖
從散點圖中可以看出,圖中的點連成的曲線是一個二次函數,y與x之間可用二次多項式來描述:yi=b0 b1xi b2xi^2 εi
該二次多項式的系數可以采用偏最小二乘法來計算。我們可以使用R語言中的lm( )函數來計算二次多項式的系數并建立回歸模型。
alloy.model<-lm(y~x I(x^2),data = alloy.data) summary(alloy.model)
從模型的輸出結果中可以看出,二次多項式回歸方程為:
使用anova( )函數進行回歸模型的方差分析。
anova(alloy.model)
從回歸模型的方差分析結果可以看出,x的一次項和二次項對y都有顯著性。
今天大家和小編一起學習如何使用R語言實現多項式回歸分析,下一期我們繼續學習非線性回歸模型中的多元非線性回歸分析,期待大家與小編共同進步!!!
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!