tft每日頭條

 > 圖文

 > 數學統計中的假設檢驗

數學統計中的假設檢驗

圖文 更新时间:2024-05-14 04:01:24

這個世界充滿了不确定性,為了應對這些不确定性人類發展出了科學、技術,試圖解釋宇宙的現象,減少對未知的恐懼。牛頓的機械論給了我們一個貌似可以預知的世界,所有的現象都可以由确定的公式、定理、定律來推知,但量子力學卻告訴我們這個世界的本質是不确定性。世界觀級别的沖突無法用統一的方法調和。概率的方法給我們描述不确定性的數學工具,貌似一根救命稻草,混沌理論卻又告訴我們貌似随機的現象其實背後也是簡單的規則。我們到底經曆了怎樣的折磨,可能需要在哲學中尋找救贖!

在災難來臨之際,會冒出什麼神漢、巫師妄圖預測未來,那麼他們說的對不對呢?我們可以拿起科學的武器來加以驗證,這個就是統計推斷要解決的一類重要的問題,假設檢驗。但這個工具的應用也是有約束的,不是放之四海皆可用的,但至少有個工具,讓我們應對不确定性的時候更多了一份信心。

思想很簡單,就是我們提出一個假設,然後通過實驗觀察到的數據來判斷假設是否正确。方法就是:先提出一個統計量,然後假設這個統計量的值(比如均值),如果通過計算實際值與假設值偏離很大,就不接受這個假設。就是先蒙猜一個值,然後再從實驗出發看看蒙的對不對(大白話就是這麼說)。所以從上述描述中我們看出,檢驗是簡單的,隻要給出假設和檢驗公式,但蒙的水平高不高,這個有講究,假設檢驗就是講如何能夠蒙的更加準!我懷疑很多街頭算命的麻衣術士,都精通此道。(高手都在民間)

但是檢驗的結果也可能出現錯誤,因為我們是基于樣本做出的判斷,如果樣本有偏差就會導緻結果出現偏差,這個叫假陰性,也是統計推斷的第一類錯誤(昏官,把李逵當李鬼),那麼對稱的叫做假陽性(就是把李鬼當李逵了,也是昏官),稱為第二類錯誤。我們無法避免上述兩種錯誤,但是可以将上述錯誤控制在一個可以接受的限度之内,也就說1000個官裡隻要不超過10個昏官就是可以接受的。數學表示P(李鬼是李逵的判定依據}<=a。括号内的統計量(判定依據)我們稱為檢驗統計量,而這個a稱為顯著性水平。念做:在a顯著水平下,針對李逵是李逵假設檢驗李逵不是李逵。李鬼不是李逵稱為原假設、李鬼是李逵是備擇假設(哈哈哈哈)。這個a稱為臨界點,而拒絕假設的統計量範圍稱為拒絕域。所以确定檢驗标準的時候(統計量選擇),我們要減少第一、第二類錯誤,但這兩類錯誤不可能同時減少(要同時減少就要增加樣本量,所以為什麼大數據的方法會降低錯誤率就是這個原因),魚和熊掌都不能兼得的時候,我們隻能考慮其中一個了,通常我們以減少第一類錯誤(假陰性,甯可錯殺一千,不能放走一個)為準,這種檢驗稱為顯著性檢驗。有時我們檢驗的命題為a不等于b,那麼a有可能大于b,也有可能小于b,這叫做雙邊檢驗,如果我們檢驗的命題為a大于b(稱為右邊檢驗)或者a小于b(稱為左邊檢驗)這種類型的統稱為單邊檢驗。如果上述标黑的概念放在一起講一句話,對概念不熟悉的話肯定直接趴下了。

所以看到假設檢驗的流程很簡單了,先做一個假設(李鬼不是李逵),然後提出一個能夠驗證假設的檢驗統計量(拿着闆斧、胡子拉茬、身高190等等),并在指定的顯著水平下(比如誤判律不超過5%),求出拒絕域,然後給出結論是不是接受假設(是不是很像參數估計啊)。這個流程講的比較口語化,大家要想得到更官方的描述請參考教材。這個總體的原則理解了t檢驗、f檢驗就都能理解了,他們就是針對不同的統計量選擇的不同方法,原理都是一樣的,提綱挈領是最高效的學習方法,但是真正掌握還是要适當做一些練習才行。

Z檢驗:總體正态分布的條件下,方差已知、均值未知的條件下,利用均值相關的統計量來确定拒絕域;

T檢驗:總體正态分布的條件下,方差、均值均未知,利用t統計量來确定拒絕域;

X2檢驗:總體正态分布,方差、均值均未知,利用X2統計量确定拒絕域;

F檢驗:兩個總體滿足正态分布,方差、均值均未知,利用F統計量來确定拒絕域。

假設檢驗和置信區間:這兩個概念有着天然的聯系,置信區間講的是求出置信水平為1-a的區間,這個a如果正好是假設檢驗問題中的臨界點,這兩個概念就聯系起來了。也就是假設假設檢驗的拒絕域與置信區間一緻。

p值法:是由檢驗統計量根據樣本值計算出的被拒絕的最小顯著性水平,如果比假設的a小就拒絕,大就接受。(比較的是與a的位置關系,比a小則落在了拒絕域外就不接受,反之則接受。)這個就是一個具體的應用,确定了檢驗統計量後很容易算,大家知道概念就好了。


數學統計中的假設檢驗(算法數學基礎-告訴你假設檢驗的概念和方法)1

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved