tft每日頭條

 > 科技

 > 數據統計學和數據分析

數據統計學和數據分析

科技 更新时间:2024-07-09 02:27:42

上期我們已經了解描述性統計學,今天我們來看看推斷性統計。

二、推斷性統計

定義:根據樣本數據推斷總體的數據特征。

1、基本步驟

産品質檢的時候用的幾乎都是抽樣方法的推斷性統計,推斷性的過程就是一種假設檢驗,在做推斷性統計的時候我們需要明确幾點:

1)問題是什麼?——

2)需要明确的證據是什麼?

3)判斷标準是什麼?

明确後可以對應我們假設檢驗的幾個步驟了:

1)提出原假設(H0)和備選假設(H1),确定顯著性水平(原假設為正确時,人們把它拒絕了的概率)

2)選擇檢驗方法,确定檢驗統計量

3)确定P值,作出統計推理

假設對于某一個器件,國家标準要求:平均值要低于20。

某公司制造出10個器件,相關數值如下:15.6 16.2 22.5 20.5 16.4 19.4 16.6 17.9 12.7 13.9

運用假設檢驗判斷該公司器件是否符合國家标準:

1)設假設:

原假設:器件平均值>=20;

備擇假設:器件平均值<20;

2)總體為正态分布,方差未知,樣本為小樣本,因此采用T檢驗。

3)計算檢驗統計量:樣本平均值17.17,樣本标準差2.98,檢驗統計量為 (17.17-20)/(2.98/√10)=-3.0031

4)當置信度選擇97.5%,自由度為9,此時為單尾檢驗,臨界值為2.262。

5)由于-3.0031<-2.262,拒絕原假設,因此接受備擇假設,該器件滿足國家标準。

2、假設檢驗類型

•單樣本檢驗:檢驗單個樣本的平均值是否等于目标值

•相關配對檢驗:檢驗相關或配對觀測之差的平均值是否等于目标值

•獨立雙樣本檢驗:檢驗兩個獨立樣本的平均值之差是否等于目标值

3、統計檢驗方法

Z檢驗:一般用于大樣本(即樣本容量大于30)平均值差異性檢驗的方法。它是用标準正态分布的理論來推斷差異發生的概率,從而比較兩個平均數>平均數的差異是否顯著。

T檢驗:用于樣本含量較小(例如n<30),總體标準差σ未知的正态分布樣本。

F檢驗:F檢驗又叫方差齊性檢驗。在兩樣本t檢驗中要用到F檢驗。檢驗兩個樣本的方差是否有顯著性差異 這是選擇何種T檢驗(等方差雙樣本檢驗,異方差雙樣本檢驗)的前提條件。

(T檢驗用來檢測數據的準确度,檢測系統誤差 ;F檢驗用來檢測數據的精密度,檢測偶然誤差)

卡方檢驗:主要用于檢驗兩個或兩個以上樣本率或構成比之間差别的顯著性,也可檢驗兩類事物之間是否存在一定的關系。

4、雙尾檢測和單尾檢測

這個和我們提出的原假設相關,例如我們檢測的原假設:器件平均值>=20;我們需要拒絕的假設就是器件平均值<20,此時就是單尾檢驗;如果我們的原假設是器件平均值>20,則我們需要拒絕的假設就是器件平均值<20和器件平均值=20,此時就是雙尾檢測;

5、置信區間和置信水平

在統計學中,幾乎都是依據樣本來推斷總體的情況的,但在推斷的過程中,我們會遇到各種各樣的阻礙和幹擾,所以我們推斷出的結果不是一個切确的數字,而是在某個合理的區間内,這個範圍就是置信區間。

但整體中所有的數據都在這個範圍也不現實,我們隻需要絕大多數出現在置信區間就可以了,這裡的絕大多數就是置信水平的概念,通常情況我們的置信水平是95%。

置信區間[a,b]的計算方法為:(z分數:由置信水平決定,查表得)

a = 樣本均值 - z*标準誤差,b = 樣本均值 z*标準誤差

總結:就數據分析而言,我們通過統計學可以用更富有信息驅動力和針對性的方式對數據進行操作。更深入、更細緻地觀察數據是如何進行精确組織的,并且基于這種組織結構确定數據分析的方法,來獲取更多的信息。

數據統計學和數據分析(數據分析必備統計學入門基礎知識)1

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved