tft每日頭條

 > 生活

 > 箱線圖如何繪制

箱線圖如何繪制

生活 更新时间:2024-10-05 17:07:04

當你在做數據總結分析,或者科研調查分析,甚至季度年度總結彙報,需要查看數據的分布情況以及是否有異常情況來形成結論輔助進一步分析時,那麼哪種圖表能夠清晰直觀地展現出這一信息呢?

答案就是箱線圖。

箱線圖如何繪制(箱線圖如何使用)1

箱線圖是一種用作顯示一組數據分布情況的統計圖,因型狀如箱子而得名。

箱子的頂端和底端,分别代表上下四分位數。箱子中間的是中位數線,它将箱子一分為二。從箱子延伸出去的線條展現出了上下四分位數以外的數據,由于這兩根延伸出去的線像是胡須,因此箱形圖也被稱為盒須圖。有時,箱形圖上也會出現個别的點,在胡須的末端值以外,這代表離群值,也可稱之為異常值。

箱線圖如何繪制(箱線圖如何使用)2

箱形圖最大的優勢是,它以一種簡單的方式,概括出一個或多個數值變量的分布,同時又不會占據太多空間。通過箱形圖,我們可以很快知道一些關鍵的統計值,如中位數、上下四分位數等;也可以分析是否存在離群值、離群值分别是多少。最後,我們還可以用多個箱型圖,比較多組數據的分布,從而快速獲得對數據結構、數據質量的認知。

箱線圖如何繪制(箱線圖如何使用)3

比如在上面這張圖中,我們可以看出:

①奧地利(Austria)、德國(Germany)、西班牙(Spain)的平均壽命會比較高。而白俄羅斯(Belarus)、伯利茲(Belize)和中國(China)的人均壽命相對較低(用中位數來衡量整體情況平均情況)。

②伯利茲(Belize)和中國(China)的人均壽命分布比較集中,因為箱子比較短。而奧地利(Austria)、德國(Germany)人均壽命分布比較分散。

③從各個箱形圖的中位數和上下四位數的間距也可以看出白俄羅斯(Belarus)和中國(China)的人均壽命分布是比較的對稱

...

可以看到,箱線圖能讀出非常多有用的數據,這對于我們做數據分析也是非常有幫助。那麼了解完箱線圖的實用性後,那麼我們應該如何在Stariver平台上配置箱線圖呢?

首先我們先在Stariver平台圖表庫,找到箱線圖并把它拖到看闆中。在右側字段設置中我們可以看到有個9字段可以配置,是不是感覺特别複制?不用競争,其實這是兩種配置方式,以便不同場景下的配置需求。

箱線圖如何繪制(箱線圖如何使用)4

比如在這套數據中,有各城市各時間段的最高溫、最低溫、空氣質量指數、空氣質量等級等記錄。假如我們想找出某幾個城市,在某個時間段的最高溫,并用箱線圖配置出來,我們應該怎麼做?

箱線圖如何繪制(箱線圖如何使用)5

先說第一種配置方式。如果我們需要利用前端計算,我們需要配置X軸、Y軸、分組。因此我們隻需要把相應的字段拖入,并作相應篩選即可,操作如圖:

1.把“城市”字段拖入X軸、把“最高溫”字段拖入Y軸(并設置平均值)、并把“”日期字段拖入分組中(因為是以最高溫的日期做聚合,因此在這裡拖入的是日期)。

箱線圖如何繪制(箱線圖如何使用)6

2.在“條件過濾”中,我們拖入“城市”并篩選出自己想要的城市。如在這裡我們選擇了上海、北京、南京、台北、廣州幾個城市。

箱線圖如何繪制(箱線圖如何使用)7

同樣的,把“日期”也拖入篩選,并用(a,b)設置上下限。在這裡,我們上限設置為“2020-01-31”,下限設置為“2020-01-01”。

箱線圖如何繪制(箱線圖如何使用)8

通過上述設置,我們就可以得到2020年1月份上海、北京、南京、台北、廣州這個幾個城市最高溫的平均數據。

箱線圖如何繪制(箱線圖如何使用)8

箱線圖的制作隻需兩步,是不是很簡單?

别急,我們甚至還有更簡單的制作方法。

假如你已經事先計算好各城市的極大值、極小值、上四分位值、下四分位值和中位數。

箱線圖如何繪制(箱線圖如何使用)10

那麼直接拖入相應字段中即可出圖:

箱線圖如何繪制(箱線圖如何使用)11

箱線圖如何繪制(箱線圖如何使用)12

最後,不僅僅是箱線圖,星河可視化平台還可以配置其他數據統計的圖表。而且除了配置圖表外,數聚星河還擁有強大數據分析功能(數據過濾、統計、分析),當然這些都是後話,我們将在後面的文章中講解。

以上就是兩種在星河可視化平台上面配置箱線圖的方法,你學會了嗎?

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved