tft每日頭條

 > 生活

 > 假設檢驗p值的定義

假設檢驗p值的定義

生活 更新时间:2024-09-06 00:15:14
介紹

假設檢驗p值的定義(使用p值來接受或拒絕你的假設)1

檢驗是統計學中最基本的概念之一。不僅在數據科學中,假設檢驗在各個領域都很重要。想知道怎麼做?讓我們舉個例子。現在有一個lifebuoy沐浴露。

沐浴露廠商聲稱,它殺死99.9%的細菌。他們怎麼能這麼說呢?必須有一種測試技術來證明這種說法是正确的。所以假設檢驗用來證明一個主張或任何假設。

目錄
  1. 假設檢驗的定義
  2. 零和替代假設檢驗
  3. 簡單假設檢驗和複合假設檢驗
  4. 單尾和雙尾檢驗
  5. 臨界區
  6. I型和II型錯誤。
  7. 統計學意義
  8. 信心水平
  9. 重要程度
  10. P值

将這些概念分解成小部分,這樣你就能理解它們的動機和用途。當你讀完這些,假設檢驗的基礎知識就會很清楚了!!

假設檢驗的定義

假設是關于參數值(均值、方差、中值等)的陳述、假設或主張。

假設是對你周圍世界的某件事的有根據的猜測。它應該可以通過實驗或觀察來測試。

比如說,如果我們說“多尼是有史以來最好的印度隊長”,這是一個假設,我們是根據他擔任隊長期間球隊的平均輸赢情況做出的。我們可以根據所有的匹配數據來測試這個語句。

零假設和替代假設檢驗

零假設是在假設為真的前提下,檢驗假設是否可能被拒絕。類似無罪的概念。我們假定無罪,直到我們有足夠的證據證明嫌疑人有罪。

簡單地說,我們可以把零假設理解為已經被接受的陳述,例如,天空是藍色的。我們已經接受這個聲明。

用H0表示。

替代假設補充了零假設。它與原假設相反,替代假設和原假設一起覆蓋了總體參數的所有可能值。

用H1表示。

讓我們用一個例子來理解這一點:

一家肥皂公司聲稱他們的産品平均殺死99%的細菌。為了檢驗這家公司的主張,我們将提出零和替代假設。

零假設(H0):平均值等于99%

替代假設(H1):平均值不等于99%。

注意:當我們檢驗一個假設時,我們假設原假設是真的,直到樣本中有足夠的證據證明它是假的。在這種情況下,我們拒絕原假設而支持替代假設。

如果樣本不能提供足夠的證據讓我們拒絕零假設,我們不能說零假設是真的,因為它僅僅基于樣本數據。零假設成立需要研究整個總體數據。

簡單假設檢驗和複合假設檢驗

當一個假設指定了參數的精确值時,這是一個簡單的假設,如果它指定了一個值的範圍,則稱為複合假設。例如

  • 某電單車公司聲稱某車型每升平均行駛裡程為100公裡,這是一個簡單假設的案例。
  • 一個班學生的平均年齡大于20歲。這是一個複合假設。
單尾和雙尾假設檢驗

如果替代假設在兩個方向(小于和大于)給出了在零假設中指定的參數值的替代,則稱為雙尾檢驗。

如果替代假設隻在一個方向(小于或大于)給出了在零假設中指定的參數值的替代,則稱為單尾檢驗。例如

  • H0:平均值等于100
  • H1:平均值不等于100

根據H1,平均值可以大于或小于100。這是一個雙尾檢驗的例子

同樣,

  • H0:平均值>=100
  • H1:平均值<100

在這裡,平均值不到100。這叫做單尾檢驗。

拒絕域

拒絕域是樣本空間中的拒絕區域,如果計算值在其中,那麼我們就拒絕零假設。

讓我們用一個例子來理解這一點:

假設你想租一套公寓。你從不同的真實國家網站列出了所有可用的公寓。你的預算是15000盧比/月。你不能再花那麼多錢了。你所訂的公寓清單的價格從7000/月到30000/月不等。

你從列表中随機選擇一個公寓,并假設以下假設:

  • H0:你要租這套公寓。
  • H1:你不會租這套公寓。

現在,既然你的預算是1.5萬,你必須拒絕所有高于這個價格的公寓。

在這裡所有價格超過15000成為你的拒絕域。如果随機公寓的價格在這個區域,你必須拒絕你的零假設,如果公寓的價格不在這個區域,你就不能拒絕你的零假設。

根據替代假設,拒絕域位于概率分布曲線的一條或兩條尾巴上。拒絕域是與概率分布曲線中的截止值相對應的預定義區域。用α表示。

臨界值是将支持或拒絕零假設的值分隔開的值,并根據alpha進行計算。

稍後我們将看到更多的例子,我們将清楚地知道如何選擇α。

根據另一種假設,拒絕域出現了三種情況:

案例1)這是一個雙尾檢驗。

假設檢驗p值的定義(使用p值來接受或拒絕你的假設)2

案例2)這種情況也被稱為左尾檢驗。

假設檢驗p值的定義(使用p值來接受或拒絕你的假設)3

案例3)這種情況也被稱為右尾檢驗。

假設檢驗p值的定義(使用p值來接受或拒絕你的假設)4

I型和II型錯誤

因此,第一類和第二類錯誤是假設檢驗的重要課題之一。讓我們把這個話題分解成更小的部分來簡化它。

假設檢驗p值的定義(使用p值來接受或拒絕你的假設)5

一個假正例(I型錯誤)——當你拒絕一個真的零假設時。

假負性(II型錯誤)——當你接受一個錯誤的零假設時。

  • 犯I型錯誤(假正例)的概率等于臨界區α的顯著性水平或大小。α=P[當H0為真時拒絕H0]
  • 犯II型錯誤(假陰性)的概率等于β。β=P[當H1為真時不拒絕H0]

例子:

這個人因犯有入室盜竊罪而被捕。由法官組成的陪審團必須裁定有罪或無罪。

H0:人是無辜的

H1:人有罪

第一類錯誤是如果陪審團判定某人有罪[拒絕接受H0],盡管此人是無辜的[H0是真的]。

第二類錯誤将是當陪審團釋放該人[不拒絕H0]雖然該人有罪[H1是真的]。

統計學意義

為了理解這個話題,讓我們考慮一個例子:假設有一家糖果廠每天生産500克的糖果。工廠維修後的一天,一名工人聲稱他們不再生産500克的糖果,可能是少了或多了。

那麼,這名工人憑什麼宣稱這一錯誤?那麼,我們應該在哪裡畫一條線來決定糖果條重量的變化呢?這一決定/界限在統計學上具有重要意義。

置信水平

顧名思義,我們有多自信:我們在做決定時有多自信。LOC(置信水平)應大于95%。不接受低于95%的置信度。

顯著性水平(α)

顯著性水平,用最簡單的術語來說,就是當事實上是真的時,錯誤地拒絕零假設的臨界概率。這也稱為I型錯誤率。

這是I類錯誤的概率。它也是拒絕域的大小。

一般來說,在測試中,它是非常低的水平,如0.05(5%)或0.01(1%)。

如果H0在5%的顯著性水平上沒有被拒絕,那麼我們可以說我們的零假設是正确的,有95%的把握。

P值

假設我們在1%的顯著性水平上進行假設檢驗。

H0:平均值<X(我們隻是假設一個單尾檢驗的情況。)

我們得到臨界值(基于我們使用的測試類型),發現我們的測試統計值大于臨界值。因此,我們必須在這裡拒絕零假設,因為它位于拒絕域。

如果零假設在1%時被拒絕,那麼可以肯定的是,在更高的顯著性水平上,比如5%或10%,它會被拒絕。

如果我們的顯著性水平低于1%,那麼我們是否也必須拒絕我們的假設呢?

是的,有可能發生上述情況,而“p值”正在發揮作用。

p值是可以拒絕零假設的最小顯著性水平。

這就是為什麼現在很多測試都給出p值,而且它更受歡迎,因為它給出的信息比臨界值更多。

  • 對于右尾檢驗:p值=P[檢驗統計量>=檢驗統計量的觀察值]
  • 對于左尾檢驗:p值=p[檢驗統計量<=檢驗統計量的觀察值]
  • 對于雙尾檢驗:p值=2*p[檢驗統計量>=|檢驗統計量的觀察值|]

p值決策

我們比較p值和顯著性水平(alpha)對零假設做出決定。

  • 如果p值大于alpha,我們不拒絕零假設。
  • 如果p值小于alpha,我們拒絕零假設。
,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved