欢迎来到天天文库
浏览记录
ID:8211890
大小:2.73 MB
页数:138页
时间:2018-03-10
《缺失值处理统计方法的模拟比较研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Y793‘,76学校代码:学号:四川大学硕士学位论文10610$022214题目缺失值处理统计方法的模拟比较研究及应用作专指导教师姓名奎嚏坠塾蕉Z.Oo五年四月二十七日硕士学位论文I冲文摘要缺失值处理统计方法的模拟比较研究及应用目的通过数据模拟技术比较MI和其它缺失值填补方法的优劣,探讨各自的适用性.将适用于本研究资料的填补方法应用于缺失值填补,为进一步的数据分析及相关因素研究奠定基础.方法横断面资料单调缺失模式连续变量的处理:采用Adhoc法和条件均数填补法(conditionaImeanimputation)进行处理,并采
2、用MI中的趋势得分法(propensityscore.Ps)和预测均数匹配法(predictivemeanmatching,PMM)进行填补并做比较.横断面资料单调缺失模式分类变量的处理:采用Adhoc法和MI中的logistic回归方法进行处理并做比较.横断面资料任意缺失模式连续变量的处理:采用Adhoc方法处理并与Ml中的马尔可夫链蒙特卡罗(MarkovChainMonteCario。MCMC)方法填补结果进行比较。纵向资料缺失数据的处理:采用Adhoc方法、LOCF法处理并与Ml方法中的MCMC模型填补结果进行比较.最后
3、,采用Ml中的MCMC模型进行了实例应用.结果当数据缺失率低于10%时,用Adhoc方法即可处理;横断面单调缺失数据缺失率低于20%时,条件均数填补法结果较优;纵向数据缺失率低于20%时,LoCF填补结果较优;当数据缺失超过20%时,MI填补效果较优;其中,当分类变量缺失率超过40%时MI填补无效;对于横断面连续变量,缺失率不超过60%时,Ml结果较优;而对于纵向资料连续变量的处理,MI的优势范围相对狭窄,缺失率在20%一40%.不管是横断面资料还是纵向硕士学位论文资料,当连续变量数据任何一种缺失模式的缺失率超过60%时,Ml
4、填补无效.结论研究结果显示,传统的缺失值处理方法在一定范围内仍具有一定优势,但MI发挥优势的空间较大。MI方法能够处理各神类型的随机缺失数据,且填补效率较高。关键词缺失值填补方法模拟技术多重填补法马尔可夭链蒙特卡罗法2硕士学位论文II.AbstractASimulatedComparitiveStudyandApplicationofStatisticalMethodsinDatasetswithMissingValuesObjectiveToexploretheapplicabilityincludingadvanteges
5、anddisadvantagesofmultipleimputation(MI)andothermissing‘datahandlingmethodsinsimulateddatawithmissingvalues.MethodsPropensityscore(PS)andpredictivemeanmatching(PMM)methodsinMIaswelIasAdhocmethdsandconditionalmeanimputationmethodwereusedandcomparedinmonotonemissingpa
6、tternaboutcontiousvadablesincross.sectionaldata.Inmonotonemissingpatternabo.utcategoricalvariablesincross-sectionaldata,thelogisticregressionmethodinMIandAdhocmethodswereempoyedandcompared.MarkovChainMonteCarlo(MCMC)modelinMlcomparedwithAdhocmethodswereusedinarbitra
7、rymissingpatlemaboutcontiousvariablesincross-sectionaIdata.andMCMCmodeIinMIcomparedwithAdhocmethodsandLOCFwereusedinlongitudinalcontiousdatawithmissingvalues.Finally'toimputesomevanableswithmissingvaluesinasurveyofmaternalandchildrenhealth.theMCMCmethodinM1wasemploy
8、ed.,,Result=Adhocmethodsworksasmissingrateislessthan伯%inalIkindsofdatainthisresearch.andthecondRionalmeanimputationmethodisappropnatewhenm
此文档下载收益归作者所有