基于多重插补法的因果推断研究

基于多重插补法的因果推断研究

ID:23930918

大小:784.16 KB

页数:43页

时间:2018-11-11

基于多重插补法的因果推断研究_第1页
基于多重插补法的因果推断研究_第2页
基于多重插补法的因果推断研究_第3页
基于多重插补法的因果推断研究_第4页
基于多重插补法的因果推断研究_第5页
资源描述:

《基于多重插补法的因果推断研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:0212单位代码:10190研究生学号:201502027密级:公开硕士学位论文张冬阳2018年6月基于多重插补法的因果推断研究CausalInferenceBasedonMultipleImputation硕士研究生:张冬阳导师:单娜副教授申请学位:理学硕士学科:统计学所在单位:数学与统计学院答辩日期:2018年6月授予学位单位:长春工业大学摘要摘要从古至今,人们在生产和生活中的很多活动都是基于因果关系的思维进行的。不仅如此,探究复杂事物之间的因果关系也是流行病学、经济学、统计学和社会科学等

2、众多领域研究的一个重要内容。因此,因果关系的研究具有极其重要的理论意义及现实意义。因果推断研究中,一个重要的因果模型是虚拟事实模型,也称为潜在结果模型。在这个模型中,为了能够清楚地定义因果关系,引入了一个重要变量,即潜在结果变量。但由于单一个体的观测数据只可能得到一种结果,所以潜在结果变量的引入导致数据集中大量数据的缺失。本文主要是针对因果推断中虚拟事实模型中的缺失数据填补进行研究。运用多重插补的方法对虚拟事实模型中的缺失数据进行填补,并进一步进行因果效应的估计。本文我们首先介绍了因果虚拟事实模型的相

3、关知识,并给出了潜在结果变量缺失时,对缺失数据的插补方法—多重插补法。这种方法填补了虚拟事实模型中潜在结果变量的缺失信息,并根据填补后的完整数据集,进行平均因果效应的估计。此外,我们基于多重插补法的改进算法—对数二项模型算法,对缺失的潜在结果变量进行缺失值的插补,提高了平均因果效应的估计精度。最后将多重插补法应用到80084起交通事故的缺失数据中,研究司机是否系安全带对司机是否受伤的因果推断,得到了较好的因果效应估计。关键词:因果推断;潜在结果;虚拟事实模型;缺失数据;多重插补法IAbstractAb

4、stractInallages,manyactivitiesinproductionandlifearebasedoncausalinference.Exploringcausalrelationshipsbetweencomplexthingsisanimportantpartofresearchinmanyfieldssuchasepidemiology,economics,statisticsandsocialsciences.Therefore,thestudyofcausalinferenc

5、ehasextremelyimportanttheoreticalandpracticalsignificance.Intheresearchaboutcausalinference,animportantcausalmodelisthecounterfactualmodel,alsoknownaspotentialoutcomesmodel.However,sinceobservationsfromasingleindividualcanonlyyieldoneresult,theintroduct

6、ionofpotentialoutcomesleadstoinalotofmissinginthedataset.Thisarticlemainlyfocusesontheresearchofmissingdatainthecounterfactualmodelincausalinference.Themethodofmultipleimputationisusedtofillinthemissingdatainthecounterfactualmodelandfurtherestimatetheca

7、usaleffect.Inthispaper,wefirstintroducetherelevantknowledgeofthecounterfactualmodel,andgivemultipleimputationwhenthepotentialoutcomesaremissing.Thismethodfillsinmissinginformationofpotentialoutcomesincounterfactualmodelandestimatestheaveragecausaleffect

8、basedonthecompletedataset.Inaddition,wehaveimprovedthelog-binomialmodelbasedonmultipleimputationmethod.Interpolationofmissingvaluesformissingpotentialoutcomesimprovestheestimationaccuracyoftheaveragecausaleffect.Finally,themultip

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。