線性回歸模型的建模步驟
圖一,明顯可以看出是一個線性回歸的例子。
圖二,是一個曲線,可能是抛物線,可能是對數曲線,去拟合相應的曲線模型。肯定不能使用線性回歸。
圖三,具有明顯的相關性,但是有一個強影響點存在,拟合後肯定會使得模型的斜率增大。一般處理方式,确認數據是否正确;對于問題是否有代表性,可以考慮删除;對于這個點的影響,使用對照的方法,建立一個有異常點和沒有異常點的模型,看看影響的強弱。如果實在無法删除,可以使用變量變換,是數據的影響減弱,也可以考慮其他的回歸模型。
圖四、末端最高點也是一個強影響點,處理流程與圖三類似。
如果數據不處理,使用線性回歸拟合後的模型是一樣的,因此在做回歸前一定是需要看散點圖的。
圖一是殘差随着y的增大在0附近波動,是一種比較理想的狀态,正态性和方差齊性都還好。
圖二,殘差随着y的增大,波動開始增加,方差不齊的問題。
圖三表示,在殘差中存在一個自變量的平方項;找出高次項拟合正确的方程。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!