tft每日頭條

 > 科技

 > excel統計分析基本方法和優缺點

excel統計分析基本方法和優缺點

科技 更新时间:2024-07-23 18:18:21

小易将在這篇文章中為大家揭曉許多數據分析師都不一定掌握的統計分析功能。

經過前面幾篇文章的介紹,相信大家都對Excel的數據分析有了一定的了解。下面先給大家簡單介紹一下“統計分析功能”以及“什麼是統計分析?”

使用Excel的“統計分析功能”需要建立在完成了數據處理操作的前提下,因為數據不“幹淨”,經過“統計分析”得出的數據結論就沒什麼價值了。

Excel的“統計分析功能”位于它的分析工具庫中,一般需要我們手動加載這一功能。

當然,Excel的分析工具庫的功能十分強大,它包含的遠不止一個“統計分析功能”,還有“方差分析”和“預測分析”等等,但是小易這次給大家介紹的主要是“統計分析功能”~

加載指南:

單擊工具欄的“文件”。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)1

再單擊彈出頁面左下方的“選項”。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)2

在“Excel選項”頁面中找到左側的“加載項”,并在“加載項”中找到“分析工具庫”,此時需要選中下方“管理”中的“Excel加載項”再點擊“轉到”。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)3

在接下來的窗口中勾選“分析工具庫”後,點擊“确定”就可以開始使用“統計分析功能”啦~

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)4

具體使用入口見下圖。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)5

接下來估計會有好奇的小夥伴問“那麼什麼是統計分析呢?”小易這就告訴大家~

統計分析是以概率論為理論基礎,根據試驗或觀察得到的數據來研究随機現象,對研究對象的客觀規律做出種種合理的估計和判斷。總的來說就是我們需要運用統計分析的知識來處理搜集到的海量數據,将其轉化為便于我們得出結論的數據。

前菜上完了,下面進入正題~

本篇文章主要介紹的是如何應用“統計分析功能”中的“描述統計”和“直方圖”工具來描述和觀察數據的重要特征,以及“假設檢驗”中的應用“t-檢驗”、“F-檢驗”和“z-檢驗”工具根據樣本數據來判斷總體數據的分布特征。

描述統計

描述統計

描述統計的任務是描述随機變量的統計規律性。要完整地描述随機變量的統計特性需要分布函數

但在實際問題中,求随機變量的分布函數是比較困難的。很多時候也不需要去全面考察随機變量的變化規律,而隻需知道随機變量的某些特征。

例如,在研究某一地區居民的消費水平時,在許多場合隻需知道該地區的平均消費水平

又如在分析某個年齡段兒童的生長發育情況時,常常關心的是該年齡段兒童的平均身高平均體重

再如檢查一批燈泡的質量時,既需要注意燈泡的平均壽命,又需要注意燈泡壽命與平均壽命的偏離程度,平均壽命較長、偏離程度較小,質量就較好。

盡管這些數值不能完整地描述随機變量,但能描述随機變量在某些方面的重要特征。

随機變量的常用統計量有平均值、标準誤差、标準偏差、方差、最大值、最小值、中值、峰值、衆數、偏斜度等。其中,平均值描述了随機變量的集中程度,而方差描述了随機變量相對于平均值的離散程度,是最常用的兩個統計量。

當需要計算一組數據的一些常用統計量時,可使用Excel提供的統計函數來實現,但更便捷的方法是使用Excel提供的描述統計工具,它能同時給出一組數據的許多常用統計量。

示例:利用某個班級3門課程的考試成績數據來運用描述統計功能。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)6

選中數據後,點擊“數據分析”,在彈出的窗口中選中“描述統計”。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)7

按照上述操作點擊确定後,彈出“描述統計“窗口。此時确認輸入區域為”$B$1:$D$16“,輸出區域為”$F$1“。并選中”标志位于第一行“、”彙總統計“、”平均數置信度-95%“、”第K大值-3”、”第K小值-3”。

分組方式:通常情況Excel會根據指定的輸入區域自動選擇;

标志位于第一行複選框:若輸入區域包含标志行,則必須勾選此複選框。否則Excel會自動以列1、列2、列3……作為數據的列标志;

彙總統計:若勾選,則顯示描述統計結果,否則不顯示;

平均數置信度:勾選此框,并輸入要使用的置信度,則輸出包含均值的置信度,本例輸入95%;

第K大值:根據需要指定要輸出數據中的第幾個最大值,本例輸入3;

第K小值;根據需要指定要輸出數據的第幾個最小值,本例輸入3。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)8

輸入完有關參數後點擊确定,即得到描述統計結果。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)9

直方圖

直方圖可以更直觀地看出成績的分布情況。雖然可以使用Excel提供的函數和圖表向導完成制作,但分析工具庫的直方圖更加方便。

制作直方圖首先需要定義組距,即一組按升序排列的邊界值。Excel将統計在當前邊界點和相鄰的高值邊界點之間的數據個數,并據此繪制直方圖。本例中根據成績的優、良、中、及格和不及格分類,在表中的“B19:B24”單元格區域設置的組距如下圖。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)10

“直方圖”的入口和“描述統計”的入口一緻。都位于“數據-分析-數據分析“。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)11

在彈出的“直方圖“窗口中,選中輸入區域為”$B$2:$B$16“(因為本例使用線性代數成績繪制直方圖),接收區域為”$B$20:$B$24“,輸出區域為”$F$1“,并選擇輸出方式為”圖标方式“,再點擊确定即可得到直方圖。

标志:本例指定的數據未包含标志,故不勾選;

輸出方式:根據需要确定是否選擇柏拉圖、累積百分率、圖表輸出複選框。若選定柏拉圖,則統計結果按頻率從大到小的順序排序;若選定累積百分率,則統計結果中增加一列頻率累積百分比數值,并同時在直方圖中添加累積百分比折線;若選定圖表輸出,則根據統計結果畫出直方圖。本例隻勾選圖表輸出複選框。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)12

假設檢驗

假設檢驗的基本思想可以應用小概率原理來解釋,即小概率事件在一次試驗中是幾乎不可能發生的。如果對于總體的某個假設是真實的,那麼不支持這一假設的小概率事件A在一次試驗中竟然發生了,人們就有理由懷疑該假設的真實性,從而拒絕假設。

假設檢驗問題常見于根據樣本觀測值來判斷總體假設是否成立的問題中。

處理假設檢驗問題的一般步驟:

  • 根據實際問題的要求,提出原假設H0及備擇假設H1;
  • 給定顯著性水平α和樣本容量n(α的值視具體情況而定,通常取0.1、0.05、0.01及0.005等值);
  • 确定檢驗統計量和拒絕域的形式;
  • 按P{拒絕H0/H1為真}=α求出拒絕域;
  • 根據樣本觀測值所求出的統計量确定是接受還是拒絕原假設H0。

本次講述的假設檢驗共分為三類:基于成對數據的“t-檢驗 成對二樣本分析”、雙樣本假設問題中的“F-檢驗 雙樣本方差“和”t-檢驗 雙樣本等方差假設“。

t-檢驗 成對二樣本分析

基于成對數據的t-檢驗常用于逐對比較法中,即有時為了比較兩種産品、兩種儀器、兩種方法的差異,常在相同的條件下進行對比試驗,得到一批成對的觀察值,然後分析觀察數據做出推斷。

示例:運用t-檢驗分析某體育療法對減肥的作用。

現随機抽取了12位病人進行試驗,除參加該體育療法外,其餘一切條件都盡可能地做到相同,先需根據試驗前後測得體重數據判斷這種新體育療法對減肥是否具有顯著作用。

樣本數據如下。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)13

“t-檢驗 平均值的成對二樣本分析”的入口同上,位于“數據-分析-數據分析”。下面就可以對樣本數據使用分析方法啦~

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)14

根據上述操作後,需要在彈出的“t-檢驗 平均值的成對二樣本分析“窗口中輸入相應參數。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)15

變量1的區域:指定試驗前的數據所在單元格區域B1:B13;

變量2的區域:指定試驗後的數據所在單元格區域C1:C13;

假設平均差:根據實際問題輸入假設成對觀測樣本d的均值μd。本例中假設樣本x與樣本y的平均值相等,所以輸入0;

标志:指定的數據區域包含标志行則勾選;

α值:根據需要指定顯著性水平,本例為0.05;

輸出區域:選中将結果輸入到輸出區域。

輸入完參數後點擊确定,即得到下列分析結果。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)16

根據結果可看出,樣本的t統計量為4.745664,大于t雙尾臨界值2.200985,所以拒絕原假設H0,即在置信度α=0.05的情況下,實施新體育療法前後的數據有顯著差異。由此得出結論:這種新體育療法對于95%以上的人具有減肥作用,療效顯著。

上述示例針對的還隻是來自同一總體的樣本數據,下面介紹的兩個方法則是針對來自兩個總體的雙樣本數據進行分析。

F-檢驗雙樣本方差

示例:在機床上進行一項試驗,以确定改進的操作方法是否會增加産品的優質率,以及是否會改變産品優質率的波動性。試驗在同一機床上進行,每生産一批零件時除了操作方法外,其他條件都盡可能相同。先後用标準方法和改進方法進行生産,交替進行,各生産了10批零件,得到有關産品優質率的兩組樣本。樣本數據如下。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)17

”F-檢驗 雙樣本方差“的入口同上,位于”數據-分析-數據分析“。下面就使用該工具來檢驗兩總體樣本的方差。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)18

在彈出的窗口中輸入相應參數,即可獲得檢驗結果。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)19

變量1的區域:指定試驗前的數據所在單元格區域B1:B13;

變量2的區域:指定試驗後的數據所在單元格區域C1:C13;

标志:指定的數據區域包含标志行則勾選;

α值:根據需要指定顯著性水平,本例為0.05;

輸出區域:選中将結果輸入到輸出區域。

檢驗結果如下圖。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)20

由檢驗結果可看出兩個總體方差相等,即改進的操作方法與标準方法相比,兩者的産品優質率的波動性沒有顯著變化。

t-檢驗 雙樣本等方差假設

由“F-檢驗 雙樣本方差“的檢驗結果可假設兩總體的方差相等,因此要檢驗改進的方法能否提高産品的優質率,可以使用”t-檢驗 雙樣本等方差假設“工具來進行檢驗。

”t-檢驗 雙樣本等方差假設“的入口同上,位于”數據-分析-數據分析“。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)21

同樣地在彈出的窗口中輸入相應參數,得出檢驗結果。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)22

變量1的區域:指定試驗前的數據所在單元格區域B1:B13;

變量2的區域:指定試驗後的數據所在單元格區域C1:C13;

假設平均差:根據假設,示例輸入0;

标志:指定的數據區域包含标志行則勾選;

α值:根據需要指定顯著性水平,本例為0.05;

輸出區域:選中将結果輸入到輸出區域。

檢驗結果如下圖。

excel統計分析基本方法和優缺點(數據分析幹貨隐藏在Excel中的統計分析功能)23

從檢驗結果可看出,t=-4.29<-t單位臨界值=-1.73,所以可認為改進的操作方法較原來的方法更好,能明顯提高産品的優質率。

以上就是本次Excel的“統計分析功能“的全部内容啦~

小易還會繼續分享數據分析的幹貨知識哦~請保持關注!

整理不易,點贊、轉發幫忙點一下~

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved