一個數據分析報告裡面,也少不了統計表。别以為隻有統計圖能被畫得很醜,統計表醜起來,那也叫一個慘絕人寰!報告裡面的統計表,往往長這樣。
表xxx 我很醜,但我也不溫柔
這還是做了點美化之後的效果,我們以這個表為例,說說做統計表時候常見的幾個問題。
1
表格的樣式
先說這個表,橫線豎線都齊全,沒毛病,就是難看。難看在哪裡,表格線條太多!水媽評語:報告交完了不浪費,下來能接着用這個表格下五子棋呢。
水媽最推崇的表格形式,是“三線表”。三線表,顧名思義隻有三條線。下表是一篇學術論文中的三線表(來源:Bayesian measures of model complexity and fit, J. R. Statist. Soc. B, 2002)。上下兩條線,是表格的上下邊緣;中間的一條線,區分了列标題和表的内容。如果你願意花點心思,可以讓上下線更粗一點,這樣比較美觀。
同學們,咱都長點心,以後不用把橫線豎線畫得那麼齊全,學會制作三線表,或者在其基礎上靈活調整。
2
表格的基本要素
3
表格的其他細節
數據分析報告裡面,常見這麼幾種統計表:數據說明表、頻數分布表、模型結果表等等。今天我們講一下數據說明表的作用以及注意事項。後面會陸續講講其他的。
一份數據分析報告,數據介紹與說明是必要且重要的環節。讀者能夠通過這個環節了解數據的來源、包含的變量以及數據的基本情況等。在介紹數據變量時,非常忌諱簡單的羅列,例如下面這個錯誤示範。
本數據包含了以下變量:
- 年齡:嗯,沒啥可說的;
- 性别:也就是男和女;
- 收入:都不怎麼高;
- 出生地:包括20個水平,貴陽、建陽、慶陽、小沈陽……
……
- 是否患有某種疾病:終于寫完了!
這種羅列介紹變量的辦法,混亂無邏輯、冗雜無重大、醜陋無前途!且看一個正确示範。
這是狗熊會精品案例中的一個數據變量說明表(手動比心關關老師),基本樣式是三線表,顔色上還做了些細心處理。
示例:數據變量說明表
由于現在的數據集都比較大,變量很多,所以在做數據分析報告的時候,有必要做這麼一個數據變量說明表讓讀者能夠比較容易地了解數據情況。數據變量說明表建議包含以下内容。
,
- 變量名。盡量以中文命名,比較易懂。展示的時候,要提前進行歸納分組,這樣比較有邏輯。比如上表,把自變量分成【駕駛人因素】和【汽車因素】。
- 詳細說明。包括變量的類型(定量變量、定性變量等)、單位、取值範圍等。這部分的組織視情況而定,水媽的建議是不需太詳盡,給一個總括即可。
- 備注說明。數據變量說明表,也可以發揮描述分析的作用,為後面的統計分析分擔一部分工作。比如【駕駛人性别】這個變量,有兩個取值。如果後續描述分析環節,采用餅圖來展示性别分布,沒有必要。那麼就可以在數據說明表的備注裡面說明男性(或者女性)的占比。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!