tft每日頭條

 > 生活

 > kp值計算方法

kp值計算方法

生活 更新时间:2024-11-25 00:29:02

對于公衛人來說,在統計學的殿堂中,P值是神聖的,有着超乎尋常的地位。然而,P值總是給我們的實驗和數據分析帶來一些意想不到的結果,或好或壞,令人深受P值的荼毒。

kp值計算方法(小衛智庫對于P值問題)1

那麼,我們今天就來探讨一項近幾年來在學術界引起的争議問題——P值以及P值該不該廢?

首先,和大家說一下,P值是什麼?

P值是什麼

P值是用來判定假設檢驗結果的一個依據,根據不同的分布類型使用分布的拒絕域來比較P值與檢驗水準的大小以做出對應的推斷結論。

P值的意義

P值(P value)就是當原假設為真時,所得到的樣本觀察結果或更極端結果出現的概率。

如果P值很小,說明原假設情況的發生的概率很小,那麼一旦出現了原假設的結果,根據小概率原理,我們就有理由拒絕原假設。P值越小,我們拒絕原假設的理由越充分。總之,P值越小,隻能越有理由拒絕原假設。

但是檢驗的結果究竟是“顯著的”、“中度顯著的”還是“高度顯著的”需要我們自己根據P值的大小和實際問題來判斷。

P值與Ⅰ類錯誤的關系

說到P值,我們就會想到Ⅰ類錯誤。在我們統計課本的學習中,我們認為P值和Ⅰ類錯誤是等價的。但是在實際的應用中,這種誤解會極大地影響研究的可重複性、醫療實踐中的治療選擇和實證分析中的模型規範[1]。

P值哪裡存在争議(缺點)

衆所周知的,P值是統計有效性的“黃金标準”。在計算機時代,即使是複雜的統計,P值也很容易計算,P值的範圍在0-1之間,并且可以被人們直接的理解;大多數受過統計學訓練的人可能都同意:P值低表示可能有(統計學)意義,而當P值較高時,這一點就不那麼明顯了。

低P值通常出現在一些臨床研究出版物的結果中;這些文章經常對P值進行重複的評價,P值的含義幾乎普遍被曲解,很多學者認為僅僅通過P值得出的結論是不可靠的,而且會經常誇大不利于零的證據[2]。

P值還被指責本質上具有欺騙性,因為它們将效應大小和樣本量混淆成一個令人困惑的數字。另外,還需注意,P值不是客觀的衡量标準,它們不具備我們認為的證據的性質。但從邏輯上講,似乎有資格作為支持或反對任何事情的衡量标準。

舉個例子:

假設一種止痛藥有24小時的有效記錄,而現在另一家制藥商聲稱其新的非處方藥可以持續更長時間。

一名調查員想要測試這一說法是否屬實。研究人員沒有從所有服用新藥的患者那裡收集數據(這通常是不可行的),而是決定随機調查50名患者,以收集新止痛藥持續多長時間(小時)的數據。

因此,研究人員現在有了一個随機變量X,即來自50名患者樣本的平均小時數。這是一個随機變量,因為50名患者是随機選擇的,在進行調查和計算平均值之前,沒有人知道這個變量的值是多少。

然而,每個調查都産生一個固定的數字X,它本身不是随機變量,而是随機變量X的實現或觀測(以下,設X表示随機變量,X表示固定值,即X的觀測)。

直觀地說,如果調查得出的值(止痛藥的平均持續時間)非常接近24,比如23或25,研究人員就不會相信新的止痛藥更糟或更好。如果調查達到平均32小時,調查者會相信它确實持續了更長時間。

如果調查顯示平均持續時間為22或26小時,很難得出結論。這種新止痛藥的使用時間真的更短、更長,還是随機産生的(畢竟,隻有50名患者接受了調查)?[2]

這樣的話,我們難以得知,很難僅僅通過P值的大小,進行判斷誰更有效。

歸根到底,就是因為我們通過統計學方法算出來的P值存在不确定性,統計測試的結果确實會影響我們做出推斷——即:是否認為一個經過測試的假設可能是正确的。

因此,評估統計測試結果就是判斷它們對科學命題的證據支持與否。不幸的是,P值不是在該過程中使用的可靠度量。P值也不是一個假設真實性的可靠指标,無論它是零假設還是替代假設。

P值該廢麼?

對于P值何去何從的問題,一直争論不休,沒有統一的學術界标準。引起熱議的是在2019年,3位統計學家在《Nature》上發布公開信,号召專家們放棄追求“統計學意義”,這封公開信一周之内吸引了超過800名研究人員共同支持。這不禁引起作為小白的我們深思,統計學還有用麼,我們還要不要繼續學習統計學呢?

kp值計算方法(小衛智庫對于P值問題)2

▲ 圖片來源于網絡

三位統計學家提出建議,首先要明确必須停止的事:永遠不應該僅僅因為P值大于阈值(如0.05)就得出“沒有差異”或“沒有關聯”的結論;或者,僅僅因為置信區間包含0就得出這樣的結論。

然而,在我們學習統計學的過程,我們卻理所當然的把P=0.05作為顯著性的标準。同時,我們在開始學習統計學的時候,一直被告誡,統計學上的顯著性,并不等于臨床上的顯著性。我們要回到具體問題具體分析上。

也就是說,統計學的結果有不确定性,然而我們沒有一種方法,能夠明确的進行不确定性的判斷,所以說,禁止顯著性檢驗和接受不确定性,盡管在許多情況下是合理的,但幾乎沒有提供一個新的方法對我們的研究來進行判斷。

簡而言之,我們迫切的需要正确的理解P值,需要進一步探索如何更好的進行統計分析,選擇合适的指标來取代P值。讓統計分析更好地理解運用于實際中。

同時,三位科學家指出,停止使用P值,并不是禁止。在某些情況下,P值仍然可以作為決策的标準。這其實與我們學習的統計學并不沖突,也就是說,避免P值的決定性标準,改變傳統的非黑即白的判斷,即如果僅僅側重于統計學意義的估計和讨論是有偏見的。

總之,我們對待科學研究要抱有懷疑的态度,切莫以偏概全,要做到具體問題具體分析。不要太相信統計分析的數據結果,要結合實際情況和專業知識去判斷是否具有實際意義。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved