對總體分布未知,通過樣本檢驗總體分布假設,這種檢驗方法就是非參數檢驗,非參數檢驗方法應用也比較廣泛,是統計中的重要組成部分,相對于參數檢驗而言,非參數檢驗所需的假定條件比較少,不依賴總體的分布類型,用來檢驗數據是否來自同一個總體。在非參數檢驗中,會講解卡方檢驗、二項式分布檢驗、遊程檢驗、單樣本K-S檢驗、兩獨立樣本的非參數檢驗、多獨立樣本的非參數檢驗、兩配對樣本的非參數檢驗、多配對樣本的非參數檢驗,本次介紹卡方檢驗,目的是通過樣本數據的分布來檢驗總體分布與期望分布或其他某一理論分布是否一緻,零假設:樣本的總體分布與期望分布或理論分布無顯著差異。
話不多說,直接上操縱。
原始數據
原始數據
利用卡方檢驗,檢驗骰子點數是否是均勻分布,即骰子的點數是否是随機的。
操作:分析→非參數檢驗→舊對話框→卡方
非參數檢驗-卡方
期望全距
從數據中獲取:對應檢驗變量所有的值
使用指定的範圍:确定檢驗變量上下限的值
期望值
所有類别相等:表示期望為均勻分布
值:輸入期望頻數值,輸入,添加(注意順序)順序與檢驗變量類别值相對應
卡方檢驗
精确
僅漸進法:适用于樣本數據服從漸進分布,或者樣本較大
Monte Carlo:适用于樣本數據不滿足漸進分布,或者樣本較大
精确:主要适用于小樣本
精确
統計量
描述性:輸出檢驗變量的描述統計量
四分位數:輸出檢驗變量的第25,50,75的百分位數
缺失值
按檢驗排除個案:在分析過程中,僅記住在變量上缺失的個案,分析時用到的變量予以剔除
按列表排除個案:剔除含有所有缺失值的個案
選項
輸出結果
描述性統計量 | ||||||||
N |
均值 |
标準差 |
極小值 |
極大值 |
百分位 | |||
第 25 個 |
第 50 個(中值) |
第 75 個 | ||||||
骰子點數 |
45 |
3.73 |
1.737 |
1 |
6 |
2.00 |
4.00 |
5.00 |
從上表可知,本次骰子點數個案有45個,均值為3.73,标準差為1.737,骰子最小值(極小值)為1,最大值(極大值)為6。
骰子點數 | |||
觀察數 |
期望數 |
殘差 | |
1 |
6 |
7.5 |
-1.5 |
2 |
8 |
7.5 |
.5 |
3 |
4 |
7.5 |
-3.5 |
4 |
11 |
7.5 |
3.5 |
5 |
6 |
7.5 |
-1.5 |
6 |
10 |
7.5 |
2.5 |
總數 |
45 |
上表可知,骰子點數為1的出現6次,為2的出現8次,以此類推,由于是均勻分布,所以期望數為7.5(45/6),殘差是觀察數減去期望數。
檢驗統計量 | |
骰子點數 | |
卡方 |
4.733a |
df |
5 |
漸近顯著性 |
.449 |
a. 0 個單元 (0.0%) 具有小于 5 的期望頻率。單元最小期望頻率為 7.5。 |
上表可知,卡方值為4.733,漸進顯著性為0.449>0.05,所以不能拒絕零假設,即接受零假設,說明樣本分布與期望分布是無顯著性差異的,即骰子點數的次數是均勻分布的
今天的數據分析就學習到這裡,有任何問題可以評論留言,如有想看的操作講解,可以私信我。謝謝大家的點贊、關注和轉發。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!