欢迎来到天天文库
浏览记录
ID:23930918
大小:784.16 KB
页数:43页
时间:2018-11-11
《基于多重插补法的因果推断研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:0212单位代码:10190研究生学号:201502027密级:公开硕士学位论文张冬阳2018年6月基于多重插补法的因果推断研究CausalInferenceBasedonMultipleImputation硕士研究生:张冬阳导师:单娜副教授申请学位:理学硕士学科:统计学所在单位:数学与统计学院答辩日期:2018年6月授予学位单位:长春工业大学摘要摘要从古至今,人们在生产和生活中的很多活动都是基于因果关系的思维进行的。不仅如此,探究复杂事物之间的因果关系也是流行病学、经济学、统计学和社会科学等
2、众多领域研究的一个重要内容。因此,因果关系的研究具有极其重要的理论意义及现实意义。因果推断研究中,一个重要的因果模型是虚拟事实模型,也称为潜在结果模型。在这个模型中,为了能够清楚地定义因果关系,引入了一个重要变量,即潜在结果变量。但由于单一个体的观测数据只可能得到一种结果,所以潜在结果变量的引入导致数据集中大量数据的缺失。本文主要是针对因果推断中虚拟事实模型中的缺失数据填补进行研究。运用多重插补的方法对虚拟事实模型中的缺失数据进行填补,并进一步进行因果效应的估计。本文我们首先介绍了因果虚拟事实模型的相
3、关知识,并给出了潜在结果变量缺失时,对缺失数据的插补方法—多重插补法。这种方法填补了虚拟事实模型中潜在结果变量的缺失信息,并根据填补后的完整数据集,进行平均因果效应的估计。此外,我们基于多重插补法的改进算法—对数二项模型算法,对缺失的潜在结果变量进行缺失值的插补,提高了平均因果效应的估计精度。最后将多重插补法应用到80084起交通事故的缺失数据中,研究司机是否系安全带对司机是否受伤的因果推断,得到了较好的因果效应估计。关键词:因果推断;潜在结果;虚拟事实模型;缺失数据;多重插补法IAbstractAb
4、stractInallages,manyactivitiesinproductionandlifearebasedoncausalinference.Exploringcausalrelationshipsbetweencomplexthingsisanimportantpartofresearchinmanyfieldssuchasepidemiology,economics,statisticsandsocialsciences.Therefore,thestudyofcausalinferenc
5、ehasextremelyimportanttheoreticalandpracticalsignificance.Intheresearchaboutcausalinference,animportantcausalmodelisthecounterfactualmodel,alsoknownaspotentialoutcomesmodel.However,sinceobservationsfromasingleindividualcanonlyyieldoneresult,theintroduct
6、ionofpotentialoutcomesleadstoinalotofmissinginthedataset.Thisarticlemainlyfocusesontheresearchofmissingdatainthecounterfactualmodelincausalinference.Themethodofmultipleimputationisusedtofillinthemissingdatainthecounterfactualmodelandfurtherestimatetheca
7、usaleffect.Inthispaper,wefirstintroducetherelevantknowledgeofthecounterfactualmodel,andgivemultipleimputationwhenthepotentialoutcomesaremissing.Thismethodfillsinmissinginformationofpotentialoutcomesincounterfactualmodelandestimatestheaveragecausaleffect
8、basedonthecompletedataset.Inaddition,wehaveimprovedthelog-binomialmodelbasedonmultipleimputationmethod.Interpolationofmissingvaluesformissingpotentialoutcomesimprovestheestimationaccuracyoftheaveragecausaleffect.Finally,themultip
此文档下载收益归作者所有