回歸是估計一個因變量與一個或多個自變量之間關系的過程。通過比較預測結果與實際結果之間的差異率來評估回歸模型的性能。數據分析優質社群,等你加入哦~
殘差錯誤率 = 預測值 - 實際值
本篇文章将涵蓋各種回歸模型評估指标,以及何時使用哪些指标!
▏均方誤差
均值 平方 誤差 = 實際值和預測值之間的平方差的均值。
均值 = 1 / n* i 到 n 的總和
平方誤差 = (y - ŷ) ²
注意: MAE 的值越小,模型的性能就越好。
▏均方根誤差 (RMSE)
根 均方誤差,顧名思義,它是均方根值。
根 = √均方誤差
注意: MAE 的值越小,模型的性能就越好。在性能方面:RMSE >MSE
▏平均絕對誤差 (MAE)
平均值 絕對值 誤差 = 實際值和預測值之間差值的平均值。
均值 = 1 / n * i 到 n 的總和
平方誤差 = (yi - xi)
注意: MAE 的值越小,模型的性能就越好。在性能方面:RMSE = MAE
▏R² 分數
與其他指标不同,它可以用來查找目标值的預測值和實際值之間的差異。
此指标主要側重于通過将模型與使用目标值的平均值構建的随機虛拟模型進行比較來對模型的優劣進行評分。
R² = 殘差或誤差之和(實際模型的殘差)/平均總誤差之和(随機模型的殘差)
注意:當我們在數據集中添加不相關的特征時,問題就出現了,R²永遠不會減少,因為它假設在添加更多數據時,增加了數據方差,而 R² 開始增加或保持不變。
▏調整後的 R²
調整後的 R² = 已修改以修複 R² 的缺點。
開發此指标的目的是通過懲罰不相關的特征來提供準确的結果,而不考慮特征數量及其相關性。
N = 數據集大小
p = 獨立特征的數量
比較
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!