区间删失资料的非参数分析方法

区间删失资料的非参数分析方法

ID:31995329

大小:620.16 KB

页数:41页

时间:2019-01-30

区间删失资料的非参数分析方法_第1页
区间删失资料的非参数分析方法_第2页
区间删失资料的非参数分析方法_第3页
区间删失资料的非参数分析方法_第4页
区间删失资料的非参数分析方法_第5页
资源描述:

《区间删失资料的非参数分析方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第1章小完全生存数据第1章不完全生存数据在各种应用领域中,常常要通过对观测数据进行分析,为评价所研究的对象提供依据。在观测数据时,有时会发生观测目标的消失,或在观测截止日期已到时,所关注的事件仍未出现,这些现象都会导致观测数据不完全,在作统计推断时,这些数据既不能摒弃,又不能直接使用。如何通过这些数据获得尽可能多的信息,使所得的分析结果合理而又充分,在统计学的研究领域里,是重大的课题之一。关于不完全数据的处理,最早见于寿命表中,如Berskon(1942)、Berskon和Gage(1950)、Culter和Ederen(1958

2、)等写出的寿命表报告。Kaplan-Meier估计(1958)、Cox模型(1972)、Alen模型(1972)等的出现,使不完全数据的处理在理论研究与实际应用中都取得了显著的成绩,研究结果极大地丰富了统计学的内容和方法。到目前为止,针对不同类型的不完全数据,出现了一些相应的统计分析方法,随着人们对实际问题理解的深入且为了更好得满足实际应用的需要,对不完全数据的理论和应用研究,仍在不断细分和深化。1.1删失数据的描述生存数据广义地定义为某一事件出现的时间。该事件可以是死亡,也可以是疾病的康复等。在医学领域中,事件可以是术后康复;在

3、经济学中,事件可以是失业工人曾工作的时间;在保险学中,事件可以是投保人的年龄;在工业应用中,事件可以是某元件的失效等。一般而言,我们要考虑的事件是从一个状态到另一个状态的转变。死亡是活着到生命丧失的转变,术后康复是手术开始到完全康复的转变,元件的失效是元件正常工作到不能工作的转变。事件出现的时问,习惯上被称为生存时间。设x是一个随机变量,其累积分布函数为,@)=p(xsx)牛存函数为第1章不完全生存数据S(x)=1一,(z)=e(x>工),生存数据包含精确数据(exactdata)和删失数据(censoringdata)。如果一个

4、观察值x。是确切的值,我们称之为精确数据;如果X。E1。我们称x,为区间删失(intervalcensored)数据;如果区间,。左端点为一。o,则称x,为左删失(1eftcensored)数据;如果区间,,右端点为+00,则称X。为右删失(rightcensored)数据。事实上,生存数据更一般的形式是区间删失数据【LR】,比如,对于精确数据可以理解为该区间的左右端点相等,左、右删失数据可以理解为该区间的左右端点为一。。和+∞。’下面举了两个实例,实例一是右删失数据,实例二是区间删失数据。实例一:假设有六只老鼠放在致癌物质的环境

5、中——在其脚趾注入肿瘤细胞。我们观测一定大小的肿瘤的出现时间。研究者决定30周后停止试验。图1-1描述了老鼠A,B,D分别在第10周,第15周,第25周出现肿瘤;老鼠c和E到研究结束时仍没有出现肿瘤,它们的无肿瘤时间至少是30周;老鼠F在19周后意外死亡,身上并无肿瘤。这样,生存数据(无肿瘤时间)是10,15,30+,25,30+,19+(周)、这里+号表示是删失观测。幽1.1老鼠在致癌环境中的生存时间时间(周)2ABCDEF老鼠第1章不完争生存数据实例二:在某项对艾滋病病人潜伏期的研究中,感染起始时间一般未知,发病时间已知。图1

6、-2描述了病人A在90年8月到93年8月间感染,98年7月发病;病人B在93年11月到95年11月间感染,02年6月发病;病人C在95年12月感染,02年4月发病;病人D在92年2月到94年2月感染,01年10月发病;病人E在93年2月到97年12月问感染,00年1月发病;病人F在90年6月到92年6月问感染,00年10月发病。将各病人的发病潜伏期用区间表示分别为:(60,96】,(so,104】,【77,77】,(93,118】,(25,84】,(101,126】,单位为月。AB雯cDEF图1-2艾滋病发病潜伏期时间时f可1.2

7、区问删失数据的self-consistent估计记,。,,:,A,1。为区问删失数据的观察值,设其中有占个不相同的观察值,这些数据呵被整理成:Ⅳ。个“,,1),Ⅳ:个(f:,‘),⋯,和N。个(f。,0),Ⅳl+A+Ⅳg—N。如果对任意的f和,,区间爿,满足4,nl。=中(空集)或爿,,3第1章不完全生存数据则称彳,为内含区问(innermostinterval)。令4J和6』分别为AJ的左右端点。设爿。,A:,A,A。为,。,,:,A,,。的所有互不相同的内含区问,且满足口1E岛≤n2E62sA董口。s6。。令6口三1(』,c,

8、.)。对区间删失数据的厂义极大似然估计(GMLE),已有几种数值算法。Peto(1973)给出Newton—Raphson算法,Tumbull(1976)给出self-consistent算法,Groneboom和Wellner(1992)给出co

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。