1、功能介绍

生存分析:是根据试验或调查得到的数据,对某一事件结局发生情况和发生时间进行分析和推断,研究它们与其他风险因素间的关系。在临床医学,生物学,社会学等研究领域均有它的身影。

生存资料:包含结局变量,时间变量和因素变量,分别指结局发生情况(如病发,死亡等)、结局未发生前的随访时间以及待检验因素。在临床研究中,结局变量通常为二值型变量,包括结局发生和删失两种情况。

删失值:若在指定随访期限内未观察到结局发生,则该类数据均被认为是删失值。数据删失包含以下三种情况:中途失访、实验范围外结局发生(如意外死亡)、结局最终未发生。

2、生存分析原理简介

在临床研究中,常规的生存分析操作主要关注以下三点:

如何计算生存曲线上对应时间点的生存概率?

如何计算中位生存时间?

如何检验不同组生存概率在某因素下是否存在显著差异?

针对上述问题,小编将简要介绍生存分析理论中常见的Kaplan-Meier 生存概率估计法与Log-Rank检验法:

2.1 Kaplan-Meier 生存概率估计法

作为一种非参数估计法,KM方法本质上是往期生存概率的不断累乘,其核算公式如下:

通过KM估计法,我们就可以求得生存曲线上对应时间点的生存概率,关于生存曲线的具体描绘方法,大家感兴趣可以参考文章:

http://www.360doc.com/content/17/0626/11/6175644_666623573.shtml

另外,根据KM估计法求得生存概率后,我们只需要找到当生存概率为50%所对应的时间点,该点值即为中位生存时间。

2.2 Log-Rank检验法

同样作为一种非参数检验法,Log-Rank检验法可用于比较不同组别生存曲线或生存函数,从而确定某一待检验因素对于事件结局的发生情况是否存在显著影响。

Log-Rank检验法在某种程度上类似于卡方检验,关于Log-Rank检验的详情大家可参考文章:https://zhuanlan.zhihu.com/p/350013312

2、平台操作

以一份肝癌病发数据为例,选择结局变量(事件变量)为“failure”,failure=0表示存在删失情况,failure=1表示事件结局发生;选择时间变量为time,分组变量为sex。

参数方面,选择输出结果为含置信区间的生存曲线,同时输出风险表与删失表,坐标x轴刻度间隔选择为20个时间单位、X轴的最大值为180,y轴的最小值为0。

生存分析结果如下表,Log Rank秩和检验统计量值为2.591,对应p值等于0.107,按照Log Rank秩和检验结果,认为不同sex的患者生存时间无显著性差异。