tft每日頭條

 > 科技

 > 數據分析之方差

數據分析之方差

科技 更新时间:2024-08-17 16:03:39

數據統計分析一般采用專業的統計軟件來完成,如SPSS、SAS等等,因為使用難度過大,并且需要具備一定的統計知識和編程知識,所以這樣的統計軟件不容易上手。除此之外,我們可以用Excel自帶的簡單易用的分析工具來實現統計分析任務。

Excel提供了一個數據分析加載工具——“分析工具庫”,它操作簡單,在進行複雜數據統計分析時可節省許多複雜計算步驟,隻需要為每一個分析工具提供必要的數據和參數,該工具就會使用适當的統計函數,在輸出表格中顯示相應的結果。其中有些工具在生成輸出表格是還能同時生成表格。

Excel分析工具庫可以完成的數據統計分析包括:描述統計、直方圖、相關系數、移動平均、指數平滑、回歸等19種統計分析方法。Excel默認情況下是不加載分析工具庫的,如需安裝,隻需要在【文件】-【加載項】中選中分析工具加載進來即可,操作方法和加載PowerPivot工具一樣。

回顧之前學過的統計學知識,結合Excel分析工具庫,我們可以輕松地避開許多複雜的統計運算。

數據分析之方差(每天一點數據分析)1

Excel分析工具

描述統計

我們使用分析工具庫裡的“描述統計”來分析用戶消費金額數據,單擊【描述統計】,在彈出的對話框中,對各類參數進行相關設置,即可得出相關結果。其中,輸入區域輸入的是需要統計的行列數,輸出區域定義的是輸出的位置。

數據分析之方差(每天一點數據分析)2

描述統計分析工具

結合這個例子來複習一下之前的統計學知識:

  1. 表現數據集中趨勢的指标有:平均值、中位數、衆數;

  2. 描述數據離散程度的指标有:方差與标準差;

  3. 呈現數據分布形态的指标有:峰度系數與偏度系數。

峰度系數是描述對稱分布曲線峰頂尖峭程度的指标,是相對于正态分布而言的。峰度系數>0,兩側極端數據較少,比正态分布更高更瘦,呈尖峭峰分布;峰度系數<0,表述兩側極端數據較多,比正态分布更矮更胖,呈平闊峰分布。

數據分析之方差(每天一點數據分析)3

峰度系數

偏度系數是以正态分布為标準來描述數據對稱性的指标。偏度系數=0,就是分布對稱;如果頻數分布的高峰左偏移(偏度系數<0),長尾向右側延伸稱為正偏态分布;如果頻數分布的高峰向右偏移(偏度系數>0),長尾向左延伸則稱為負偏态分布。偏度系數大于1或小于-1,被稱為高度偏态分布;偏度系數在0.5~1或-0.5~-1範圍内,被稱為中等偏态分布。偏度系數越接近0,偏斜程度就越低。

數據分析之方差(每天一點數據分析)4

偏度系數

直方圖

直方圖是用于展示分組數據分布的一種圖形,用矩形的寬度和高度來表示頻數分布,在直角坐标系中,用橫軸表述數據分組,縱軸表示頻數或頻率,各組數據與相應的頻數就形成了一個矩形,即直方圖。通過直方圖可以直觀地看出數據分布的形狀、數據分布的中心位置及數據分散的程度,由此判斷數據是否符合正态分布。

我們仍以“用戶消費數據”為例,來了解用戶消費金額的分布情況。

1、定義組距,即以一組升序排列的臨界點數據集合,Excel将統計在相鄰臨界點之間的數據頻數,也就是個數。也可以不設組距,Excel将自動以數據的最大值及最小值之間的範圍進行等距分組;

數據分析之方差(每天一點數據分析)5

組距

2、選擇【數據分析】中的直方圖,在彈出的對話框中,做出相關設置,即可生成對應設置的直方圖。

數據分析之方差(每天一點數據分析)6

直方圖分析工具

數據分析之方差(每天一點數據分析)7

直方圖生成圖表

這裡需要對柏拉圖、累計百分率做些說明。

柏拉圖是根據各組頻數大小進行降序排列并繪制的圖表,柏拉圖一般采用分類數據進行統計;直方圖則是默認按照各組組距從小到大的排序方式進行繪制,順序是固定的,不能對其進行修改。

在設置中如果勾選累計百分率,則可以在輸出表中添加一列累計百分比數值,并同時在直方圖表中添加繪制累計百分比的折線。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved