多重填补方法估计存在不依从与缺失值的随机对照试验的因果效应

多重填补方法估计存在不依从与缺失值的随机对照试验的因果效应

ID:33381678

大小:4.73 MB

页数:115页

时间:2019-02-25

多重填补方法估计存在不依从与缺失值的随机对照试验的因果效应_第1页
多重填补方法估计存在不依从与缺失值的随机对照试验的因果效应_第2页
多重填补方法估计存在不依从与缺失值的随机对照试验的因果效应_第3页
多重填补方法估计存在不依从与缺失值的随机对照试验的因果效应_第4页
多重填补方法估计存在不依从与缺失值的随机对照试验的因果效应_第5页
资源描述:

《多重填补方法估计存在不依从与缺失值的随机对照试验的因果效应》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、复旦大学博士学位论文多重填补方法估计存在不依从与缺失值的随机对照试验的因果效应姓名:张熙申请学位级别:博士专业:流行病与卫生统计学指导教师:林燧恒2012-04复旦大学博士学位论文中文摘要多重填补方法估计存在不依从与缺失值的随机对照试验的因果效应因果效应估计的困难在于反事实效应的存在使得估计个体的因果效应值成为不可能的事情。随机干预试验是进行因果效应估计的唯一金标准,能够突破反事实效应进行因果效应估计的坚实保证是随机化。理想的随机化认为,随机被分配到试验组与对照组的个体是均衡可比的,实质上就是对照组的个体与试验组的个体除了处理不同之外完全相同。在随机化的保证下

2、,因果效应的估计成为可能。而实际研究过程中往往很难做到完美的随机化,不依从的出现严重的破坏了随机化。由于不依从出现的背景是比较复杂的,不会仅仅是研究样本的随机样本,总会和某些因素存在着关联,致使干预试验研究的因果效应估计值出现较大的偏倚,甚至给出错误的估计。因此不依从数据的因果效应估计方法的研究是非常有必要的。目前不依从数据的因果效应估计方法很多,本文针对连续型变量,非交叉设计的干预试验研究进行因果效应估计。本研究将处理缺失值的思想应用于不依从数据的因果效应估计中。应用比较成熟的缺失数据处理方法:多重填补方法,将不依从数据看做是缺失值进行多重填补。首先通过意向

3、性分析(ITT,Intention-to.treat)估计填补完成之后的多个完整数据集的因果效应值,再应用Rubin(1987)规则将多个ITT估计值进行合并获得最终的估计值。多重填补过程选用SAS9.2软件中的MI过程完成,通过模拟实验比较研究多重填补ITT估计(砌TT)与另外四种现存的估计方法:实际治疗分析(AT,As.treated)、符合方案集(PP,Per-protoc01)、ITT估计以及工具变量估计(IV,InstrumentalVariableEstimate)。模拟实验研究通过计算估计值的以下四个指标对各个估计方法的准确性与可靠性进行评价:偏

4、倚(Bias),均方根误差(RMSE,RootMeanSquareError)以及95%置信区间覆盖率以及95%置信区间的平均长度。并通过风华中学心理抗逆力干预试验研究数据评价估计方法的实用性效果。模拟研究结果显示,样本量与不依从率是影响估计准确性的两个重要因素,小样本时各个估计值的均方根误差都比较大,并且各个估计值之间的差别比较大;随着样本量的增加,各估计值的均方根误差有降低的趋势,而且估计值之间的差别也有减小的趋势。不依从率的增加使估计值的均方根误差有增加的趋势。另外,复旦大学博士学位论文中文摘要这两者之间存在着交互效应。样本量的增加可以抵消一部分由于不依

5、从率增加带来的均方根误差的增加,样本量较大的时候,各估计方法之间的均方根误差差别不大。MIITT'fi!i计的95%置信区间的覆盖率总是能够保持在95%左右,PP、瞄计的95%置信区间的覆盖率也能够保持在95%左右,ITTf古计的波动性比较大。95%置信区间的平均长度会随着样本量的增加显著的变窄,随着不依从率的增加又适当的变宽。该研究结果提示我们在进行试验设计的时候,可以通过适当的调整样本量来抵御不依从以及缺失带来的偏倚,但是要协调好样本量与成本效益之间的关系。完全随机缺失机制与不依从数据混合存在的情况下,模拟结果基本与无缺失仅有不依从数据的情况下一致,没有太

6、大的改变。随机型缺失机制下,按照缺失数据的生成机制分成了两类进行模拟研究,MIITT住i计准确性比较好的情况是缺失相关变量k与其余研究变量没有关联的情况,该情况下各个估计之间的差别变得比较明显。缺失率增加,各个方法估计的RMSE以及偏倚都会增加。另一种是缺失相关变量为基线测量X,这种情况下MIITT'fdi计效果并不是最好的,与AT以及PP估计的均方根误差相差不大。当干预效应增加为l的时候,IV与ITT估计的州SE在依从率比较大的时候是最大的,MIITT'fi!i计次之,PP与AT最小。当干预效应增加为3的时候,AT、PP以及MIITT'fi!i计的I洲S日E

7、常接近。估计值的95%置信区间的覆盖率与不依从率以及样本量的变化关系不明显。MIITT{芒i计的覆盖率始终位于95%2皇右,但是缺失相关变量为基线测量与相关变量为k相比,前者的95%置信区间的覆盖率更逼近于95%。缺失率的增加会使得区间的长度增宽,并且相关变量为.k时,区间长度更宽。AT与PP估计的置信区间随着不依从率等影响因素的变化比较明显,而MII丌{古计的变化比较微小。总之,MIITT'fi!i计相对于其他四种比较方法而言,是一种比较准确、可靠的估计方法,尤其是在有缺失值存在的情况下。在只有不依从数据存在或者缺失机制为完全随机缺失的情况下,MIITT'f

8、di计与PP、A]防法基本差不多,与Ⅳ

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。