統計中有不同類型的數據,用于被收集、分析、解釋和呈現。數據是記錄的個别事實信息,用于分析過程的目的。數據分析的兩個過程是解釋和呈現。統計是數據分析的結果。數據分類和數據處理是重要的過程,因為它涉及大量标簽和标簽來定義數據、其完整性和機密性。
統計數據中隻有兩類數據,即定性數據和定量數據。
通過日常的例子可以學習到以下知識:
分類數據和數值數據
俗稱離散型數據(分類數據)、連續型數據(數值數據)。
例如一份問卷調查中
對于表格内的數據看看有什麼區别?有些可以用具體數值測量有的不能測量,因此對于數據種類的理解再次進行深入的理解為:
不可測量的數據,也稱離散型數據,在實際應用中稱分類數據。
可以測量的數據,也稱連續型數據,在實際應用中稱數值數據。
如何進行數據種類的判斷
以尺度标準來區分數據的種類,可以理解為:
結合之前的數據分類,我們可以看出來分類數據較多存在定類、定序尺度屬性。而數值數據較多存在定距、定比尺度屬性。
但是在某些情況下存在相互轉化的情況。
數據類型的相互轉化依舊以之前的問卷調查舉例來說,類别數據可以轉化成數值數據,數值數據也可以轉化成類别數據,但是實際上表達的意義并不會發生多大的變化。
針對下面的内容數據可以進行對應的量化處理。
1.類别數據進行量化
對于文字 非常有趣、有點興趣、一般 可以使用 1、2、3 來進行表述。對于文字 男 、女 可以使用 0、1 來進行表示。雖然表達的形式變化了,但是實際的意義并不發生改變。
2.數值數據進行量化
對于連續性數據轉化,其實是轉化對應成理解的業務類别,即區間分類。 如 年齡 類别分為 少年、青少年、青年、中年 等等。對應例如青年定義的年齡是 21-25 歲,則将表格中的對應的數值轉化成對應的類别文字,然後對應的文字類别有根據類别數據進行量化處理的方式進行數值的轉化。
需要注意的是,這塊處理的業務邏輯是針對數據分析師對于業務的邏輯理解。不同的觀點對數據的理解都是不一樣的。
定性(分類)數據定性數據,也稱為分類數據,描述适合類别的數據。定性數據不是數字。分類信息涉及描述諸如人的性别、家鄉等特征的分類變量。分類度量是根據自然語言規範定義的,而不是根據數字定義的。
有時分類數據可以保存數值(定量值),但這些值沒有數學意義。分類數據的示例是生日、最喜歡的運動、學校郵政編碼。在這裡,出生日期和學校郵政編碼保留了數量值,但沒有給出數字含義。
标稱數據名義數據是定性信息的一種,它有助于在不提供數值的情況下标記變量。标稱數據也稱為标稱尺度。它不能被訂購和測量。但有時,數據可以是定性和定量的。名義數據的示例是字母、符号、單詞、性别等。
使用分組方法檢查标稱數據。在這種方法中,數據被分組,然後可以計算數據的頻率或百分比。這些數據使用餅圖直觀地表示。
序數數據有序數據/變量是一種遵循自然順序的數據。标稱數據的顯着特點是數據值之間的差異是不确定的。這個變量多見于調查、金融、經濟學、問卷調查等。
序數數據通常使用條形圖表示。這些數據通過許多可視化工具進行調查和解釋。可以使用表格來表達信息,其中表格中的每一行都顯示不同的類别。
定量(數值)數據定量數據也稱為數值數據,它表示數值(即,多少、多久、多少)。數值數據提供有關特定事物數量的信息。數字數據的一些示例是高度、長度、大小、重量等。定量數據可以根據數據集分為兩種不同的類型。數值數據的兩種不同分類是離散數據和連續數據。
離散數據離散數據隻能采用離散值。離散信息僅包含有限數量的可能值。這些值不能有意義地細分。在這裡,事情可以用整數來計算。
連續數據連續數據是可以計算的數據。它具有無限數量的可能值,可以在給定的特定範圍内選擇。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!