tft每日頭條

 > 圖文

 > 怎麼做好看的統計圖

怎麼做好看的統計圖

圖文 更新时间:2024-10-04 20:51:37

一個數據分析報告裡面,也少不了統計表。别以為隻有統計圖能被畫得很醜,統計表醜起來,那也叫一個慘絕人寰!報告裡面的統計表,往往長這樣。

表xxx 我很醜,但我也不溫柔

怎麼做好看的統計圖(統計圖難看也就算了)1

這還是做了點美化之後的效果,我們以這個表為例,說說做統計表時候常見的幾個問題。

1

表格的樣式

先說這個表,橫線豎線都齊全,沒毛病,就是難看。難看在哪裡,表格線條太多!水媽評語:報告交完了不浪費,下來能接着用這個表格下五子棋呢。

水媽最推崇的表格形式,是“三線表”。三線表,顧名思義隻有三條線。下表是一篇學術論文中的三線表(來源:Bayesian measures of model complexity and fit, J. R. Statist. Soc. B, 2002)。上下兩條線,是表格的上下邊緣;中間的一條線,區分了列标題和表的内容。如果你願意花點心思,可以讓上下線更粗一點,這樣比較美觀。

同學們,咱都長點心,以後不用把橫線豎線畫得那麼齊全,學會制作三線表,或者在其基礎上靈活調整。

怎麼做好看的統計圖(統計圖難看也就算了)2

2

表格的基本要素

  1. 表的标題在上方(圖的标題在下方)。報告中的表,要表明序号,例如:表1、表2等等。
  2. 表要有橫、列标題,命名清晰明确。
  3. 如有需要,注明資料或者數據來源以及數據單位。

3

表格的其他細節

  1. 先說文字的統一。由于現在大家分析的數據集,列名常常是英文命名或者是漢語拼音之類,導緻論文中的表格,經常中英文混雜。水媽在這裡的建議是,盡量都統一成中文,這樣方便閱讀也不用來回解釋英文的含義。咱沒見過哪個英文論文裡面,還混雜着一堆中文不是。
  2. 再說内容的對齊。某一列,定了規矩(左對齊、右對齊或者居中),就保持一緻。不要一會兒居左,一會兒居中。如果中文的說明文字很長,居中的效果就會一般,顯得不整齊,可以嘗試居左或者視情況調整。
  3. 最後說說數字。統計表裡面,少不了數字。最常見的問題是小數位數的保留,要麼就是保留過多的小數位數(有的保留個5、6位),要麼就是小數位數不統一(一會兒保留2位,一會兒保留4位)。非常影響閱讀者的心情。水媽建議,保留1到2位小數位數即可。

數據分析報告裡面,常見這麼幾種統計表:數據說明表、頻數分布表、模型結果表等等。今天我們講一下數據說明表的作用以及注意事項。後面會陸續講講其他的。

一份數據分析報告,數據介紹與說明是必要且重要的環節。讀者能夠通過這個環節了解數據的來源、包含的變量以及數據的基本情況等。在介紹數據變量時,非常忌諱簡單的羅列,例如下面這個錯誤示範。

本數據包含了以下變量:

  • 年齡:嗯,沒啥可說的;
  • 性别:也就是男和女;
  • 收入:都不怎麼高;
  • 出生地:包括20個水平,貴陽、建陽、慶陽、小沈陽……

……

  • 是否患有某種疾病:終于寫完了!

這種羅列介紹變量的辦法,混亂無邏輯、冗雜無重大、醜陋無前途!且看一個正确示範。

這是狗熊會精品案例中的一個數據變量說明表(手動比心關關老師),基本樣式是三線表,顔色上還做了些細心處理。

示例:數據變量說明表

怎麼做好看的統計圖(統計圖難看也就算了)3

由于現在的數據集都比較大,變量很多,所以在做數據分析報告的時候,有必要做這麼一個數據變量說明表讓讀者能夠比較容易地了解數據情況。數據變量說明表建議包含以下内容。

  1. 變量名。盡量以中文命名,比較易懂。展示的時候,要提前進行歸納分組,這樣比較有邏輯。比如上表,把自變量分成【駕駛人因素】和【汽車因素】。
  2. 詳細說明。包括變量的類型(定量變量、定性變量等)、單位、取值範圍等。這部分的組織視情況而定,水媽的建議是不需太詳盡,給一個總括即可。
  3. 備注說明。數據變量說明表,也可以發揮描述分析的作用,為後面的統計分析分擔一部分工作。比如【駕駛人性别】這個變量,有兩個取值。如果後續描述分析環節,采用餅圖來展示性别分布,沒有必要。那麼就可以在數據說明表的備注裡面說明男性(或者女性)的占比。
,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved