通過上一章的學習我們了解到頻數分布可以體現一組數據的整體狀況。但是很多時候,僅僅知道整體的狀況是不夠的。例如你在某次考試中的成績為X=65,65這個數字本身并不能提供更多的信息讓你知道這個分數是好是壞。你需要更多的信息,比如平均分數或者分數高于你的人數來評價你的成績。這就涉及到頻數分布的另一個用途,它可以用來描述整組數據中的個體位置。
1 百分位數
1.1什麼是百分位數
将原始分數轉化為更有意義的百分位數是一種常見的做法。一個特定分數的百分等級是指分布中分數低于或相等的個體的百分率。當百分等級确認時,這個分數被稱為百分位數。假設你的分數為X=65,并知道全班有60%的人的分數為65或低于65,那麼你的分數的百分等級為60%,被稱為第60個百分位數,它描述了你在這組數據分布中的确切位置。
1.2 如何确定百分位數:找出累積頻數和累積百分率
找出分布中處于或低于每個點的個體數目,用cf表示。累積百分率用c%表示。累計百分率的計算公式如下圖。
在連續數據中X并非量表中的點,而是區間。需要注意累積頻數與上實限之間的關系。
1.3 内插法
我們可以直接從頻數分布表中得到一些百分位數與百分等級。然而一些值并未直接顯示在表中。例如我們無法從上表中得知第50個百分位數是什麼。這種情況下,我們隻能估算。這種估算中間值的标準步驟我們稱之為内插法。下面我們将通過一個案例來詳細介紹計算内插法的标準步驟。計算的關鍵在于表中每個積累百分率都對應它的分數區間的上實限。
案例:用下列數據分布求出X=7.0的對應百分等級
a. X=7.0位于實限6.5-7.5限定的區間,對應實限的累計百分率為20%和44%
b. 對于數值X,區間寬度為1個單位;對于百分率c%,區間寬度為24個單位。
c. 特定分數7.0位于6.5-7.5這個區間的0.5個單位處,因此對應着百分率的12個單位處。
d. 44-12=32。可得出X=7.0對應的百分等級為32%。
3.莖葉法
莖葉法是頻數分布表或圖的簡單替代。1977年由J.W.Tukey發表。它将每個數字分為兩個部分,第一位或前幾位稱為莖,後幾位或最後一位稱為也。例如X=85,莖為8,葉為5。然後檢查數據,将每個分數的葉寫在它的莖旁。
莖葉圖與分組頻數分布十分相似。每個莖值代表對應的組距,葉的個數顯示了對應頻數。它的優勢在于
A. 容易構建,檢查一次數據就可以構建完整圖形。
B. 允許确認每個個體的具體值,而頻數分布隻能描述頻數,不能描述特定值。
C. 同時提供了數據列表與分布狀況,側面看與直方圖相同。
D. 适用于需要更加細節的分布狀況,必要的時候可以把莖再分成兩半。
雖然莖葉圖用處很大,但隻能作用于數據的初步整理,使研究者得到對實驗數據的第一印象。最後發表的數據通常還是用傳統的頻數分布表或圖來表示數據的分布情況。
至此我們介紹了描述性統計處理數據的第一個過程-将數據放入一個頻數分布。接下來我們會介紹另一個普遍使用的總結和描述數據分布的方法-集中趨勢。
參考書目:行為科學統計,現代心理與教育統計學
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!