tft每日頭條

 > 生活

 > 數據的整理與分析方差如何算

數據的整理與分析方差如何算

生活 更新时间:2024-09-18 11:20:07

方差分析(Analysis of Variance,簡稱ANOVA),用于比較多個總體的均值是否想等,由英國統計學家費希爾(Fisher)首先引入。目前已經廣泛應用于分析心理學、生物學、工程和醫藥的試驗數據。

一個例子

消費者與産品生産者、銷售者或服務提供者之間經常發生糾紛。當發生糾紛後,消費者常常會向消費者協會投訴。為了對幾個行業的服務質量進行評價,消費者協會在零售、旅遊業、航空公司、家電制造業抽取了不同的企業作為樣本。其中所抽取零售業7家、旅遊業6家、航空公司5家、家電制造業5家。每個行業中抽取的這些企業,服務對象、服務内容、企業規模等方面基本上相同的。然後統計出最近一年中消費者對總共23家企業投訴的次數,結果如下表:

數據的整理與分析方差如何算(統計學中的方差分析實操)1

問題:我們想知道這幾個行業之間的服務質量是否有顯著差異?

一般來說,被投訴次數越多,說明服務質量越差。

要分析這四個行業之間的服務質量是否有顯著差異,其實就是要判斷行業(自變量)對被投訴次數(因變量)是否有顯著影響。

相關術語

  • 因素:檢驗的對象,在上面的例子中指行業。
  • 水平:因素的不同表現,在上方的例子中指零售業、旅遊業、航空公司、家電制造業。
  • 觀測值:每個因子水平下得到的樣本數據,在上方的例子中指每個行業下得到的被投訴次數(樣本數據)。
方差分析的基本原理

1、圖形描述

繪制出被投訴次數和行業的散點圖,如下圖所示。

數據的整理與分析方差如何算(統計學中的方差分析實操)2

從散點圖可以看出,不同行業被投訴的次數是有明顯差異的,而且,在同一個行業,不同企業被投訴的次數也明顯不同。例如,家電制造業被投訴次數最多,航空公司被投訴次數較少,表明行業與被投訴次數之間有一定的關系。

說明:上方的圖形通過Excel繪制,繪制折線圖,然後調整樣式。

2、誤差分解

僅僅從散點圖上觀察還不能提供充分的證據證明不同行業被投訴次數之間有顯著差異,也許這種差異是由抽樣的随機性造成的,因此,需要更加準确的方法來檢驗這種差異是否顯著,也就是所謂的方差分析。

在方差分析中,誤差通過平方和來表述。

  • 反應全部數據誤差大小的平方和為總平方和,記為SST
  • 反應組内誤差大小的平方和稱為組内平方和,也稱為誤差平方和或者殘差平方和,記為SSE
  • 反應組間誤差大小的平方和稱為組間平方和,也稱為因素平方和,記為SSA
  • 總誤差(SST)=組内誤差(SSE) 組間誤差(SSA)

數據的整理與分析方差如何算(統計學中的方差分析實操)3

單因素方差分析

根據所分析的分類型自變量的多少,方差分析可分為單因素方差分析和雙因素方差分析。當方差分析中隻涉及一個分類型自變量時稱為單因素方差分析。

單因素方差分析研究的是一個分類型自變量對一個數值型因變量的影響,例如前面的例子,分析這四個行業之間的服務質量是否有顯著差異。

方差分析分為三步:

1、提出假設

2、構造檢驗的統計量

3、統計決策

具體操作如下:

第1步:提出假設

數據的整理與分析方差如何算(統計學中的方差分析實操)4

第2、3步:構造檢驗的統計量及統計決策,具體計算公式及相關理論如下:

數據的整理與分析方差如何算(統計學中的方差分析實操)5

說明:Excel、SPSS等分析工具可以直接給出分析結果,所以具體計算及理論可不必深究!

用Excel做單因素方差分析

下面通過單因素方差來解決前面提出的問題:

問題:我們想知道這幾個行業之間的服務質量是否有顯著差異?

第1步:提出假設

數據的整理與分析方差如何算(統計學中的方差分析實操)6

第2、3步:構造檢驗的統計量及統計決策,這裡通過Excel數據分析庫直接給出,具體操作如下。

這裡需要用到Excel中的“數據分析”庫,需要設置才能顯示出來,設置方法如下。

1、文件-選項,打開如下對話框,選擇加載項

數據的整理與分析方差如何算(統計學中的方差分析實操)7

2、選擇“Excel加載項”,單擊按鈕“轉到”,勾選分析工具庫、分析工具庫-VBA

數據的整理與分析方差如何算(統計學中的方差分析實操)8

經過以上操作,Excel中的“數據”标簽最右側會出現“數據分析”按鈕。

下面通過Excel裡面的“數據分析”庫進行單因素方差分析:

1、單擊“數據”-“數據分析”

數據的整理與分析方差如何算(統計學中的方差分析實操)9

2、選擇“單因素方差分析”

數據的整理與分析方差如何算(統計學中的方差分析實操)10

3、輸入區域,選擇數據區域,選擇範圍如下圖紅色框線指示的區域,勾選“标志位于第一行”(因為我們選擇的區域包含字段名),輸出區域選擇下方任意空白處

數據的整理與分析方差如何算(統計學中的方差分析實操)11

4、單擊确定後,Excel會直接給出單因素方差分析的結果

數據的整理與分析方差如何算(統計學中的方差分析實操)12

分析結果說明:

Excel給出的分析結果分兩塊:

1、SUMMARY(概述)

數據的描述性統計量:觀測數、求和、均值和方差。

2、方差分析表

關于方差分析的相關結論:

  • 組間誤差、組内誤差和總誤差。
  • 自由度。
  • 組間方差、組内方差。
  • P值和F值。

說明:從前面可以看出,進行方差分析需要進行大量的計算工作,手工計算十分繁瑣,通過Excel數據分析庫可以很輕松地得到結論。

統計決策:

這裡主要關注最後的P值,如果P較小(指小于0.05),則拒絕原假設,反之,則接受原假設。

這裡看到P值約為0.04,比較小,所以拒絕原假設,即不同行業的被投訴次數的均值不完全相同。

結論:不同行業的被投訴次數的均值不完全相同,即行業對被投訴次數的影響是顯著的。

你是否用過方差分析呢?通過什麼工具來做方差分析呢?歡迎留言評論!

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved