tft每日頭條

 > 科技

 > 常見的數據分析方法

常見的數據分析方法

科技 更新时间:2024-07-07 05:38:03

從同一批芯片中抽取兩份樣品,一份合格一份不合格,這說明什麼問題呢?直觀感覺可能是該批芯片的不良率太高,但還有一種可能是碰巧抽到了為數不多的不合格品。假設檢驗是一種非常重要而又常用的統計方法,其任務就是确認這份不合格的樣品到底是碰巧抽到的,還是這批芯片真的不良率太高了。

零假設

在刑事案件中,抓獲嫌疑人以後,在審判之前司法人員無法确定嫌疑人是否有罪,這時會對其進行假設,兩種方法如下。

1. 假設嫌疑人有罪,嫌疑人需要提供證據證明自己無罪,如果無法證明,就可以認定其有罪,這叫作有罪推定。

2. 假設嫌疑人無罪,司法人員需要提供證據證明嫌疑人有罪,如果無法證明,就可以認定其無罪,這叫作無罪推定。

兩種原則的優缺點屬于法學家的研究課題,但是在統計學中,假設檢驗的思想和無罪推定原則如出一轍。

先看 3 個假設命題:

™ 20 ~ 30 歲的人的平均記憶能力和 50 ~ 60 歲的人的平均記憶能力沒有差異。

™ 養老院照看老人的效果和子女親自照看老人的效果沒有差異。

™ 每天練習的短跑運動員和一周練習一次的短跑運動員在短跑成績上沒有差異。

這 3 個假設的共同之處在于,無論做哪種選擇,最後的結果都是一樣的,也可以說每種選擇之間是等價的或沒有差異的。

如果想研究 20 ~ 30 歲的人群和 50 ~ 60 歲的人群的記憶能力的差别,在沒有任何其他的信息之前,不能認為二者存在差異。在對事物沒有更多的了解之前,一般先給一個無差異的假設,這就是零假設,也被稱為原假設,就像無罪推定原則,要先給嫌疑人一個無罪的假設。

對一個或多個總體提出零假設,是假設檢驗的起點。除非能夠證明事物之間存在差異,否則要一直假設沒有差異。

背擇假設(對立假設)

零假設是指變量間沒有關系,而備擇假設是指變量間有很明确的關系,是和零假設完全相反的,所以備擇假設也稱為對立假設。例如,在上一節中的 3 個零假設,都會有至少一個相應的對立假設,如表 9-1 所示。

表 9-1 零假設和對立假設

零假設

對立假設

20 ~ 30 歲的人的平均記憶能力和 50 ~ 60歲的人的平均記憶能力沒有差異

20 ~ 30 歲的人的平均記憶能力比 50 ~ 60歲的人的平均記憶能力更強

養老院照看老人的效果和子女親自照看老人的效果沒有差異

養老院照看老人的效果比子女親自照看老人的效果差

每天練習的短跑運動員和一周練習一次的短跑運動員在短跑成績上無差異

每天練習的短跑運動員比一周練習一次的短跑運動員在短跑成績上更好

這 3 個對立假設的共同之處在于,每做一種選擇,就會有不同的結果與之相對應,也可以說每種選擇之間是不等價的或是有差異的。

有差異的關系又可以分為兩種情況,有方向的對立假設和無方向的對立假設。

例如,20 ~ 30 歲的人的平均記憶能力和 50 ~ 60 歲的人的平均記憶能力不同。隻說了兩個群體是不同的,至于怎樣不同并沒有限定,這就是無方向的對立假設。

如果将上述假設加以修改,20 ~ 30 歲的人的平均記憶能力優于 50 ~ 60 歲的人的平均記憶能力。不僅指出兩個群體是不同的,而且還說明了兩個對照群體中誰強誰弱,這就是有方向的對立假設。

假設檢驗流程

以20 ~ 30 歲和 50 ~ 60 歲的人群記憶能力對比為例,如果想知道兩個人群的記憶能力差異,步驟如下。

1.提出零假設,這是基礎,即“20 ~ 30 歲的人的平均記憶能力和 50 ~ 60 歲的人的平均記憶能力沒有差異”。相當于無罪推定。

2.分别從兩個人群中抽樣,得到兩個樣本,同時提出對立假設“20 ~ 30 歲的樣本人群的平均記憶能力比 50 ~ 60 歲的樣本人群的平均記憶能力強”。相當于司法人員對嫌疑人提出有罪指控。

3.證明對立假設是否成立,具體證明方法會在下一節中讨論。如果對立假設成立,零假設就不成立;如果對立假設不成立,那麼零假設就成立。這裡要注意的是,零假設和對立假設是完全相反的結論,是互斥的,隻要其中一個成立,另一個一定是不成立的。相當于司法人員提供證據,證明嫌疑人是否有罪,如果證據充分即可證明其有罪,如果證據不充分,則無法證明其有罪,要維持無罪的假設。

從該流程可以看出零假設和對立假設的區别如下。

1. 零假設是指兩個變量之間無差異,對立假設是指兩個變量之間有差異,兩種假設是互斥的,這是本質區别。

2. 零假設是相對總體而言的,對立假設是相對樣本而言的。先對一個總體做了零假設,然後再從中抽取樣本對其進行對立假設,所以兩種假設的主體是不同的。

常見的數據分析方法(說說數據分析中的假設分析)1

圖 9-1 假設檢驗流程

圖 9-1 展示的邏輯看上去和參數估計有些相像,參數估計是用樣本特征估計總體特征,假設檢驗是用樣本假設檢驗總體假設,都是從樣本出發解決總體問題。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved