tft每日頭條

 > 圖文

 > 統計學裡面自由度和置信度

統計學裡面自由度和置信度

圖文 更新时间:2025-02-22 20:23:52

統計學裡面自由度和置信度(生存曲線的估計方法)1

作者:丁點helper

來源:丁點幫你

生存分析的上一篇文章主要通過一張表格介紹了計算生存率的方法,稱作K-M法,也叫乘積極限法,簡單來講就是将生存概率相乘獲得生存率。

生存曲線的估計方法(1):先看懂這個表,比如,前面我們講過:

統計學裡面自由度和置信度(生存曲線的估計方法)2

好比身高的樣本均數,抽取的第一撥人計算的平均身高和第二撥人的平均身高是有差異的。

因為它們都是樣本統計量,所以會随着樣本的變化而變化。同樣地,如果我們想象一下,把這些樣本統計量放在一起再求平均數和标準差,那這次得到的這個标準差叫做什麼呢?

還記得嗎?叫标準誤。

在學習均數抽樣分布的時候,我們也重點談過的。

因此,類似的,根據樣本計算的生存函數,它也是一個樣本統計量,它也可以被計算标準誤。

理解了這一層,就應該能搞懂上一篇文章中最後一列出現的“生存率标準誤”,如下表第(9)列。

統計學裡面自由度和置信度(生存曲線的估計方法)3

這個“生存率标準誤”的計算公式稍微有些複雜,我們可以不詳細展開。重點是大家要意識到它所代表的含義:

統計學裡面自由度和置信度(生存曲線的估計方法)4

如果單單由一個樣本的生存率去代表總體,會存在誤差(類比用一個城市的平均身高代表全國的平均身高),如何去衡量這個誤差?由此我們就計算了标準誤。

因此,如果搞懂了前面講的樣本均數的标準誤等概念,這裡就直接類比即可,可見基本的統計學理論和知識點需要重點掌握。

之所以要大費周章地搞懂“生存率的标準誤”這個概念,是因為在實際應用中,我們可能經常會面臨計算生存率95%置信區間的問題。

同樣地,原理和均數95%置信區間幾乎完全類似。對這個知識點不熟悉的同學可以閱讀我們發的這篇文章。

隻要搞懂了置信區間的大邏輯,相信對下面這個生存率的95%置信區間計算公式不會陌生:

統計學裡面自由度和置信度(生存曲線的估計方法)5

因此,我們可以得出:手術後輔助化療的肺癌患者,10個月生存率的95%置信區間為(0.2848,0.8580),或者寫成百分數的形式(28.48%,85.80%)。

講完生存率置信區間的算法,我們再來複習之前介紹過的一個概念——中位生存時間。

如下圖,可以發現,當時間 t=11.124時,對應的生存率是0.5。這表示,當生存時間是11.124個月時,生存函數取值為0.5,從而意味着:

統計學裡面自由度和置信度(生存曲線的估計方法)6

統計學裡面自由度和置信度(生存曲線的估計方法)7

上圖有一個專業的名字,叫K-M生存曲線(對應前文講過的K-M乘積極限法):橫軸是生存時間,縱軸是生存率。

從圖中我們可以看出,K-M生存曲線呈階梯性,随着生存時間的增加,曲線呈下降趨勢,意味着時間越長,仍然存活的人數越少,生存率越低。如果曲線階梯陡峭,表明下降速度快,往往生存期較短。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved