tft每日頭條

 > 生活

 > 統計學線性回歸分析

統計學線性回歸分析

生活 更新时间:2024-07-30 11:15:34

回歸分析是一種預測性的數據分析方法,通過建立數據模型,研究多變量之前的數據關系。比如以下案例,研究氣溫與冰紅茶的銷量的關系,通過天氣預報來預測後續一段時間内的冰紅茶銷量。

統計學線性回歸分析(統計學之回歸分析入門)1

  • 案例

原始數據如下

統計學線性回歸分析(統計學之回歸分析入門)2

首先通過觀察散點圖,及其相關系數(0.9227),發現兩者具有很強的線性相關性

統計學線性回歸分析(統計學之回歸分析入門)3

接下來回歸分析就要出場啦。做回歸分析,就可以通過最高氣溫來預測冰紅茶的銷量了。

Excel中已經集成了部分基礎回歸分析功能。在散點圖上增加趨勢線,并選中線性、顯示公式、顯示R平方值

統計學線性回歸分析(統計學之回歸分析入門)4

散點圖就變成下圖了

統計學線性回歸分析(統計學之回歸分析入門)5

方程y=3.7379x-36.361 即為該案例的回歸方程。

顯然,本案例使用線性回歸模型,即用直線來拟合所有點,但無法保證直線精确穿過每個點。可以有很多條拟合直線,那麼該哪一條直線的拟合度較好呢。

具體思路是,計算所有點到直線的距離的平方和,選擇使這個值達到最小的直線。通過這個思路可以推導出具體的回歸方程,具體推導過程就不太贅述。

而R平方值,成為判定系數。R平方值取值範圍是0到1,使用來衡量回歸方程的精度的,越接近1說明回歸方程精度越高。反之,如果R平方值接近0,說明回歸方程可能沒有意義。

一般統計學上,R平方值在0.5以上,回歸方程有一定意義。

好了,有了回歸方程後,就可以根據未來的氣溫來預測冰紅茶的銷量了。

當然這裡隻研究了最高氣溫對冰紅茶銷量的影響,還可以進一步看最低氣溫、折扣力度以及工作日/周末等各種因素都是怎麼影響銷量的。受限于數據源,就不展開說了。

  • 說明

本案例隻是入門級的雙變量線性回歸分析,還有多變量回歸及非線性回歸,但思路基本相似,都是先拟合,再預測。既為預測,肯定誤差及準确率的問題。比如本案例中,最高氣溫是31度時,分别有84、75、73三個不同銷量,如果接下來一天最高氣溫是31度時,應該是多少呢?

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved