1.什麼是多項式回歸,線性回歸适合數據呈線性關系的問題,如果樣本呈現出來的是非線性分布,那線性回歸就不再适用,而需要适用多項式回歸。
2.多項式模型的定義,與線性模型相比,多項式引入了高次項,自變量的指數大于1,例如一元二次方程,或者醫院多次方程。多項式回歸可以看做是線性回歸的拓展,在線性回歸模型中添加了新的特征值。對于一元n次多項式,同樣可以利用梯度下降對損失值最小化的方法,尋找最優的模型參數。
3.多項式回歸模型的實現
4.過拟合和欠拟合
多項特征擴展器進行多項式擴展時,指定了最高次數為3,該參數為多項式擴展的重要參數,若果選取不當可能會導緻不同的拟合效果,下圖顯示了該參數分别設為1、20時模型的拟合圖像:
這兩種的模型都不夠好,第一種是拟合的不夠,預測準确性低,稱為欠拟合,第二種拟合的樣本更多,雖然準确度更高,但是泛化能力不強,這種現象就稱之為過拟合。
欠拟合模型一般表現為訓練集、測試集下準确度都比較低,過拟合是在訓練集下準确度高,但是測試集下準确度低,一個好的模型無論在訓練還是測試都有接近的預測精度。
如何處理欠拟合和過拟合,欠拟合,提供模型的複雜度,如增加特征,增加模型的最高次幂等,過拟合,則需要降低模型的複雜度,如減少特征,降低模型的最高次幂等。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!