肿瘤流行病学研究资料的统计分析.doc

肿瘤流行病学研究资料的统计分析.doc

ID:50893556

大小:63.50 KB

页数:4页

时间:2020-03-15

肿瘤流行病学研究资料的统计分析.doc_第1页
肿瘤流行病学研究资料的统计分析.doc_第2页
肿瘤流行病学研究资料的统计分析.doc_第3页
肿瘤流行病学研究资料的统计分析.doc_第4页
资源描述:

《肿瘤流行病学研究资料的统计分析.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、肿瘤流行病学研究资料的统计分析项永兵第四讲 生存资料单变量分析中危险率比估计  Logrank检验[1,2]是生存分析中最常用的非参数统计方法。在资料分析时,除计算假设检验统计量及相应P值外,还可以对研究因素的效应做出估计,即估计一些参数或指标,例如回归系数β或相对危险度RR。单因素分析中常用的参数是相对危险度(RR)。在生存分析中该术语经常被称为危险率比(harzardratio,HR)。国人在生存资料单因素分析的结果中仅报道假设检验统计量及P值,很少给出RR或HR的估计值,一般在Cox回归模型分析中列出它们的结果。

2、所以如何在单变量分析情形下,基于logrank检验估计RR或HR,是本讲的主要内容。  一、统计方法:以最常见的二元协变量为例,即两组比较的情形。假定两组个体在时刻t时的危险率分别为λ1(t)和λ2(t),根据Cox的比例危险假设[1,2],存在下式式中HR即危险率比。它不依赖于时间,是个常数。回到上一讲(第三讲)中关于样本资料的一些假定,例如2×2表,这里不在重复,请参考。首先看无效假设,即H0∶HR=1。而假设检验统计量则是常用的logrank检验统计量,分别有Mantel和Peto氏统计量两种。即为上一讲中的公式

3、(5)和(4)。为了叙述上的方便,这里重复这两个公式。Mantel氏统计量[1~7]和Peto氏统计量[1~5,8~11]分别为其中Peto氏(简化式)统计量比Mantel氏统计量在假设检验上较保守[1,2,10~12]。在(2)式的基础上,估计危险率比的公式[8]为式中分子为实际死亡数与期望死亡数的差,分母为方差。期望死亡数与方差的计算方法见上一讲。对数危险率比log(HR)的方差估计可以用下式而与(3)式相对应的危险率比估计公式[9,14,15]为上式分母中的期望死亡数除可用上一讲中的方法计算外,还可用下式对数HR

4、2的方差估计公式[2]为或采用下式[1]Vrlog(HR2)=1/W,(8)式中估计HR方差的目的,是为了能估计HR的95%置信区间(CI),或做假设检验。  二、实例说明:以Freireich白血病临床试验数据[1,2,16]为例,资料见表1。研究因素是治疗方法,即对照组(安慰剂组)和6-MP治疗组,也即两组比较的情形。目的是比较两组病人的生存期(预后)有没有差别,或者为了说明采用6-MP药物治疗的病人,其预后是否优于对照组。本文的重点在于估计研究因素的效应大小,即危险率比HR。表2是分析该数据的假设检验统计量、危险

5、率比及其对数的方差估计值等。为了与Cox回归模型[1,2]的分析进行对比,表中同时给出Cox回归模型的分析结果。以logrank检验为例,对照组相对于治疗组的危险率比为5.15,且有高度统计学意义。表中的结果同时也说明了简化式统计量是较保守的。与Cox方法相比,基于logrank检验的参数估计值HR似有高估的倾向,而在简化式基础上推导的参数HR则低估。表1 Freieich白血病临床试验病人随访资料(对照组和6-MP治疗组)对照组:1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,12,15, 17

6、,22,23试验组:6,6,6,6+,7,9+,10+,10+,11+,13,16,17+, 19+,20+,22,23,25+,32+,32+,34+,35+  注:生存时间单位为周;“+”表示截尾生存时间(censoringtimes)。表2 假设检验统计量及危险率比估计值方 法统计量P值RVr[log(R)]Mantel氏logrank 16.790.0000425.150.1598Peto氏(简化式)15.230.0000954.180.1450Cox15.93*0.0000704.52- 15.210.00

7、0100  *:Cox比分统计量;:似然比统计量。  为了对上述两种相对危险度的估计方法做出评价及说明它们的偏性大小,笔者利用计算机进行了模拟研究。生存时间以指数分布为例。具体做法见表3。除考查样本大小的作用以外,其它情况均是产生一个含量为1000的随机样本。其中因素效应的大小以参数β的大小来表示。需要说明的是括号内其它条件中的0.4为β;50为指数分布(生存时间)的均数;25%为截尾数据所占比例大小。结果如下:  1.样本大小:随着样本含量增加,危险率比的估计越来越稳定,偏性也越小。而不同的估计值之间却相差极小,说

8、明不同的方法不受样本含量的影响。  2.截尾数据比例:随着截尾数据所占的比例增加,危险率比的估计似出现越来越不稳定的趋势。但不同的估计方法似乎受其影响较小。  3.因素效应:随着研究因素的效应不断加强,两种估计值的偏性均越来越大,且HR1高估了真值,而HR2则低估了真值,似乎HR2的偏性大于HR1。从结果来看,当因素的作用不太强时

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。