tft每日頭條

 > 生活

 > 利用excel回歸分析

利用excel回歸分析

生活 更新时间:2024-07-17 16:33:11

一、什麼是回歸分析法

“回歸分析”是解析“注目變量”和“因于變量”并明确兩者關系的統計方法。此時,我們把因子變量稱為“說明變量”,把注目變量稱為“目标變量址(被說明變量)”。

清楚了回歸分析的目的後,下面我們以回歸分析預測法的步驟來說明什麼是回歸分析法:

1.根據預測目标,确定自變量和因變量明确預測的具體目标,也就确定了因變量。如預測具體目标是下一年度的銷售量,那麼銷售量Y就是因變量。通過市場調查和查閱資料,尋找與預測目标的相關影響因素,即自變量,并從中選出主要的影響因素。

2.建立回歸預測模型依據自變量和因變量的曆史統計資料進行計算,在此基礎上建立回歸分析方程,即回歸分析預測模型。

3.進行相關分析什麼是回歸分析法回歸分析是對具有因果關系的影響因素(自變量)和預測對象(因變量)所進行的數理統計分析處理。隻有當變量與因變量确實存在某種關系時,建立的回歸方程才有意義。因此,作為自變量的因素與作為因變量的預測對象是否有關,相關程度如何,以及判斷這種相關程度的把握性多大,就成為進行回歸分析必須要解決的問題。進行相關分析,一般要求出相關關系,以相關系數的大小來判斷自變量和因變量的相關的程度。

4.檢驗回歸預測模型,計算預測誤差回歸預測模型是否可用于實際預測,取決于對回歸預測模型的檢驗和對預測誤差的計算。回歸方程隻有通過各種檢驗,且預測誤差較小,才能将回歸方程作為預測模型進行預測。

5.計算并确定預測值利用回歸預測模型計算預測值,并對預測值進行綜合分析,确定最後的預測值。

二回歸分析的目的

回歸分析的目的大緻可分為兩種:

第一,“預測”。

預測目标變量,求解目标變量y和說明變量(x1,x2,…)的方程。

y=a0 b1x1 b2x2 … bkxk 誤差(方程A)

把方程A叫做(多元)回歸方程或者(多元)回歸模型。a0是y截距,b1,b2,…,bk是回歸系數。當k=l時,隻有1個說明變量,叫做一元回歸方程。根據最小平方法求解最小誤差平方和,非求出y截距和回歸系數。若求解回歸方程.分別代入x1,x2,…xk的數值,預測y的值。

第二,“因子分析”。

因子分析是根據回歸分析結果,得出各個自變量對目标變量産生的影響,因此,需要求出各個自變量的影響程度。

希望初學者在閱讀接下來的文章之前,首先學習一元回歸分析、相關分析、多元回歸分析、數量化理論I等知識。

根據最小平方法,使用Excel求解y=a bx中的a和b。那麼什麼是最小平方法?

分别從散點圖的各個數據标記點,做一條平行于y軸的平行線,相交于圖中直線(如下圖)

利用excel回歸分析(一文學會如何用Excel做回歸分析)1

平行線的長度在統計學中叫做“誤差”或者‘殘差”。誤差(殘差)是指分析結果的運算值和實際值之間的差。

接這,求平行線長度曲平方值。可以把平方值看做邊長等于平行線長度的正方形面積(如下圖)

利用excel回歸分析(一文學會如何用Excel做回歸分析)2

最後,求解所有正方形面積之和。确定使面積之和最小的a(截距)和b(回歸系數)的值(如下圖)。

利用excel回歸分析(一文學會如何用Excel做回歸分析)3

使用Excel求解回歸方程;“工具”→“數據分析”→“回歸”,具體操作步驟将在後面的文章中具體會說明。

三、回歸分析案例

接着上節的回歸分析的目的,我們來根據一個二手車的實例來繼續說回歸分析。

二手車價格的決定因素有:空調類型有無附加品(TV導航導航SR、天窗、空氣囊LD TV AW) 行駛距離,顔色車檢剩餘有效月數、評分拍賣會地點等。

在這14個因子(說明變量)中,最影響價格(目标變量)的是什麼?最不影響價格的是什麼?通過定量求出影響度,然後根據多個因子(說明變量)預測二手車價格(目标變量)。

利用excel回歸分析(一文學會如何用Excel做回歸分析)4

可以用方程2表示。二手車價格“這個目标變量數據,既(“空調類型(AC WC)” “有無TV導航”、 、“行駛距離”、 。車檢剩餘有效月數”, “評分”)。

利用excel回歸分析(一文學會如何用Excel做回歸分析)5

混合模型

混台模型是指因子巾既包含定性數據也包含定量數據的模型。在混台模型中.把“空調”、 “TV導航”等定性因子叫做項目,把數據群(空調的“AC”,“WAC”,TV導航的“有”、“無”)叫做類别。

接下來,根據表l進行回歸分析。

這節我們主要告訴大家回歸分析前,我們需要先根據自己的思維來了解分析,把這些需要注意的先分析出來,這樣對我們接下來的回歸分析有很大的幫助。

四、Excel回歸分析需要注意的事項

經過上節,我們了解了回歸分析前,我們要先通過思維分析出來需要注意的事項,那麼今天接着上一節的課來了解下Excel回歸分析需要注意的事項。包含的定性數據,不能直接使用Excel分析,需要将其轉換成虛拟變量(也叫O,1數據)。例如, “空調(AC、WAC)”的數據,“AC”用“1”,“WAC"用“O”表示。同樣地,“導航(有導航、無導航)”的數據, “有導航”用“1”, “無導航”用“O”表示。表1是根據這種方法轉換的(0,1)數據表。

直接使用Excel的對表1進行回歸分析時,運算結果不理想。理由如下;

利用excel回歸分析(一文學會如何用Excel做回歸分析)6

表1

以“導航”為例,各行

“有導航” “無導航”=1

此式成立。把公式變形,

“有導航”=1-“無導航”

所以“有導航”是“0”或是“1”,由“無導航。自動決定。

線性代數中發生秩(矩陣秩)虧時,不能正确求出必要的逆矩陣。因此也不能求出回歸系數。

由于上述原因,進行回歸分析時,需要從各個項目中删除—列因子(表2)。

利用excel回歸分析(一文學會如何用Excel做回歸分析)7

表2

根據表2的數據進行回歸分析,操作步驟如下:

1、“工具”一“數據分析”

2、在彈出的“數據分析”對話框中選擇“回歸”,單擊“确定”(圖1)。

利用excel回歸分析(一文學會如何用Excel做回歸分析)8

圖13、點擊“回歸”對話框的“Y值輸入區域”,選擇“二手車價格”的列數據,包括項目名稱;接着點擊“X值輸入區域”,選擇從“AC”到“中國、四國、九州”的區域,包括項目名稱;選中。标志”,單擊“确定”。(圖2)

利用excel回歸分析(一文學會如何用Excel做回歸分析)9

圖2系統彈出錯誤信息,不能進行回歸分析(圖3)。這是因為Excel回歸自由度的最大上限是16(P62小知識)。這裡的回歸自由度是22,因此不能進行回歸分析。

利用excel回歸分析(一文學會如何用Excel做回歸分析)10

圖3

統計學中經常出現“自由度”,即有效信息的數量。

前面已經提到,在Excel的回歸分析中,回歸自由度的最大上限是16。回歸自由度在(多重)回歸分析、數量化理論|、混合模型中具有不同意義。表3是對回歸自由度的不同意義的總結。

利用excel回歸分析(一文學會如何用Excel做回歸分析)11

表3

五、分兩次進行回歸分析

我們在前面提到過,當回歸自由度在17以上時,Excel無法進行回歸分析,那麼就需要分兩次進行回歸分析。第一次,把“空調”、“TV導航”、“導航”、“SR”、“天窗”、“空氣囊”、“LD”、“TV”、“AW”作為說明變量(表1),第二次,把“顔色”、“拍賣會地點”、“行駛距離”、“車檢剩餘有效月數”、“評分”作為說明變量(表2),目标變量都是“二手車價格”。

利用excel回歸分析(一文學會如何用Excel做回歸分析)12

表1

利用excel回歸分析(一文學會如何用Excel做回歸分析)13

表2對表1、表2進行回歸分析。回歸分析的結果分别如表3、表4所示(具體操作步驟将在下一節詳細說明)。

利用excel回歸分析(一文學會如何用Excel做回歸分析)14

表3

利用excel回歸分析(一文學會如何用Excel做回歸分析)15

表4

内容來源:Excel學習網

【燈塔大數據】微信公衆号介紹:中國電信北京研究院通過大數據技術創新,自主研發了業内領先的“燈塔”大數據行業應用創新平台,燈塔面向市場研究、廣告營銷、商業地理、金融征信、人力資源等諸多行業領域,提供零售研究、消費者研究、店鋪選址、精準營銷、泛義征信,背景調查等服務,助力企業在大數據時代揚帆遠航。

微信公衆号【燈塔大數據】關鍵字回複信息:

回複【雲計算産業趨勢分析】 下載分析報告PPT

回複【高峰論壇】 根據編号下載高峰論壇PPT資料

回複【主論壇】 查看《中國電信燈塔大數據高峰論壇》視頻回放

回複【技術論壇】 收看技術分論壇視頻回放

回複【推薦系統】 下載程序代碼

回複【 燈塔 】 查看更多關鍵字回複下載

利用excel回歸分析(一文學會如何用Excel做回歸分析)16

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved