作者:丁點helper
來源:丁點幫你
生存分析的上一篇文章主要通過一張表格介紹了計算生存率的方法,稱作K-M法,也叫乘積極限法,簡單來講就是将生存概率相乘獲得生存率。
生存曲線的估計方法(1):先看懂這個表,比如,前面我們講過:
好比身高的樣本均數,抽取的第一撥人計算的平均身高和第二撥人的平均身高是有差異的。
因為它們都是樣本統計量,所以會随着樣本的變化而變化。同樣地,如果我們想象一下,把這些樣本統計量放在一起再求平均數和标準差,那這次得到的這個标準差叫做什麼呢?
還記得嗎?叫标準誤。
在學習均數抽樣分布的時候,我們也重點談過的。
因此,類似的,根據樣本計算的生存函數,它也是一個樣本統計量,它也可以被計算标準誤。
理解了這一層,就應該能搞懂上一篇文章中最後一列出現的“生存率标準誤”,如下表第(9)列。
這個“生存率标準誤”的計算公式稍微有些複雜,我們可以不詳細展開。重點是大家要意識到它所代表的含義:
如果單單由一個樣本的生存率去代表總體,會存在誤差(類比用一個城市的平均身高代表全國的平均身高),如何去衡量這個誤差?由此我們就計算了标準誤。
因此,如果搞懂了前面講的樣本均數的标準誤等概念,這裡就直接類比即可,可見基本的統計學理論和知識點需要重點掌握。
之所以要大費周章地搞懂“生存率的标準誤”這個概念,是因為在實際應用中,我們可能經常會面臨計算生存率95%置信區間的問題。
同樣地,原理和均數95%置信區間幾乎完全類似。對這個知識點不熟悉的同學可以閱讀我們發的這篇文章。
隻要搞懂了置信區間的大邏輯,相信對下面這個生存率的95%置信區間計算公式不會陌生:
因此,我們可以得出:手術後輔助化療的肺癌患者,10個月生存率的95%置信區間為(0.2848,0.8580),或者寫成百分數的形式(28.48%,85.80%)。
講完生存率置信區間的算法,我們再來複習之前介紹過的一個概念——中位生存時間。
如下圖,可以發現,當時間 t=11.124時,對應的生存率是0.5。這表示,當生存時間是11.124個月時,生存函數取值為0.5,從而意味着:
上圖有一個專業的名字,叫K-M生存曲線(對應前文講過的K-M乘積極限法):橫軸是生存時間,縱軸是生存率。
從圖中我們可以看出,K-M生存曲線呈階梯性,随着生存時間的增加,曲線呈下降趨勢,意味着時間越長,仍然存活的人數越少,生存率越低。如果曲線階梯陡峭,表明下降速度快,往往生存期較短。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!