欢迎来到天天文库
浏览记录
ID:39132992
大小:1.20 MB
页数:39页
时间:2019-06-25
《广义线性混合模型下关于长期生存模型的一些讨论》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据徐瑶广义线性混合模型下关于长期生存模型的一些讨论第一章引言生存分析(survivalanalysis)Ⅲ,即生存数据的统计分析,是近年来产生且发展甚为迅速的一门应用统计的分支。在临床试验中,人们通过分析在试验过程中所观测到的被试者的一系列生理信息,来推断其所使用的医疗手段对研究病例的治疗效果。通常情况下[21,是采用从开始治疗到病发所经历的时间来衡量其病发风险。在医学上,所记录的病发时间也被称为失效时间。然而,由于研究时间及其它因素的限制(例如病人在试验期间中断治疗或是转院治疗),在试验观测期内,并不是
2、每个个体都会出现所研究的发病特征。对于那些没有发病的个体,研究者只知道他们的生存时间大于试验观测时间。于是,临床试验所产生的数据会存在这种被删失现象,因而采用的统计分析方法不同于传统的处理完全数据的方法。因为那些删失个体的存在,分析某个时刻个体的发病风险往往要比分析它的发病概率分布更为直观有效。做为一个新的统计学分支,生存分析就是用来研究这种数据类型的统计方法。1.1研究背景与现状在生存分析中,比例风险模型(即Cox模型)【31是最重要同时也是应用最广泛的一种模型。但在Cox的比例风险模型中,隐含了所有个体都会
3、最终发病(fail)的假定。然而,近些年来随着医学手段与医疗条件的不断提高与改善,在某些临床试验中,部分病人在接受治疗后不再受到所研究疾病的影响,即被认为已经治愈。对于这部分被治愈的病人或者被称为长期存活者(10ng.termsurvivor)【4】,如果继续使用Cox模型显然就不太合适。因此,长期生存模型被提出来解决这一问题。与Cox模型不同的是,长期生存模型中引入了治愈百分比,可以说,它提供了一个更为有效的方法来分析带有治愈百分比的生存数据。所谓的治愈百分比就是指长期生存者的比例,即那些再也不会经历病发(失
4、效事件)的人群比例。Farewell[5】[6】在1982年与1986年对治愈个体和未治愈个体分别采用logistic回归和Cox模型去刻画所定义的风险函数,并假定未治愈个体的基准风险函数具有Weibull分布的形式。与Farewell的方法不同,1992年KukandChen[71沿用KalbfleischandPrentice【81中推导偏似然函数的边际似然方法,将Farewell长期生存模型中的基准风险函数当作冗余参数并在推导出的似然函数中将其消掉,得到了与Cox模型相似的偏似然函数,并应用MonteCa
5、rlo万方数据扬州大学硕士学位论文2逼近的方法去估计回归参数和治愈概率。Taylor[9J在1995年也应用了KukandChen所提出的这种半参数方法,所不同的是,他们用piecewise函数法[10】去估计未治愈个体的风险函数。因为在实际中不能观测到KukandChen的半参数方法中所定义的治愈指示变量,所以在2000年,SyandTaylor[111和PengandDear[121提出用EM算澍13u各治愈指示变量看成缺失变量去迭代地估计参数。与EM算法不同,2005年Lameta1.㈣运用Tannera
6、ndWong[151中的poorman’sdataaugmentation(PMDA)技术去计算所需的参数估计。在许多医学试验经常将病人分成几组或安排在几家医院接受治疗,或是对同一病人进行一系列重复实验,所以这些试验所产生的数据可能会因各个间的差异或试验中的重复测量,而具有某种难以观测到的分组效应。广义线性混合模型(GLMMs)已被认可为是用来分析分组数据的一个强有力的工具,这是因为它们能整合所有组间数据与组内数据【l6I。目前也已经有大量的文献研究过广义混合模型有关的统计估计与统计诊断方法。比如McGilch
7、rist[171,在1993年利用广义线性混合模型,提出了生存模型的约束性极大似然(REML)估计。该方法已经拓展到分析带有随机效应的不同类型的生存数据中,比如说带有与时间相关的脆弱项的生存数据等等。之前已经有一些研究者将长期生存模型应用到这些多元生存数据上去。YauandNg[18】在2001年拓展了McGilchrist分析带有长期生存者的失效时间数据的方法,他们提出了一个长期生存者模型,其中在logistic回归与风险回归中都引入了随机效应。Ngetal.【l9】随后在2004年又修正了该方法来用于限定的
8、长期生存模型。2008年LaiandYau刚在此基础上做了更进一步的拓展,在广义线性混合模型的框架下考虑了将随机效应分别引入到logistic回归与生存模型中。然而,之前提到的这些工作主要都是适用于带有确切失效时间或删失时间的生存数据。但是在很多现实问题中,由于各种主客观条件的制约,人们观测到的数据更多的是区间删失数据,而且左删失和右删失都可以看作区间删失的特殊情况。对于区间删失数据,
此文档下载收益归作者所有