缺失值处理统计方法的模拟比较研究及应用

缺失值处理统计方法的模拟比较研究及应用

ID:8211890

大小:2.73 MB

页数:138页

时间:2018-03-10

缺失值处理统计方法的模拟比较研究及应用_第1页
缺失值处理统计方法的模拟比较研究及应用_第2页
缺失值处理统计方法的模拟比较研究及应用_第3页
缺失值处理统计方法的模拟比较研究及应用_第4页
缺失值处理统计方法的模拟比较研究及应用_第5页
资源描述:

《缺失值处理统计方法的模拟比较研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Y793‘,76学校代码:学号:四川大学硕士学位论文10610$022214题目缺失值处理统计方法的模拟比较研究及应用作专指导教师姓名奎嚏坠塾蕉Z.Oo五年四月二十七日硕士学位论文I冲文摘要缺失值处理统计方法的模拟比较研究及应用目的通过数据模拟技术比较MI和其它缺失值填补方法的优劣,探讨各自的适用性.将适用于本研究资料的填补方法应用于缺失值填补,为进一步的数据分析及相关因素研究奠定基础.方法横断面资料单调缺失模式连续变量的处理:采用Adhoc法和条件均数填补法(conditionaImeanimputation)进行处理,并采

2、用MI中的趋势得分法(propensityscore.Ps)和预测均数匹配法(predictivemeanmatching,PMM)进行填补并做比较.横断面资料单调缺失模式分类变量的处理:采用Adhoc法和MI中的logistic回归方法进行处理并做比较.横断面资料任意缺失模式连续变量的处理:采用Adhoc方法处理并与Ml中的马尔可夫链蒙特卡罗(MarkovChainMonteCario。MCMC)方法填补结果进行比较。纵向资料缺失数据的处理:采用Adhoc方法、LOCF法处理并与Ml方法中的MCMC模型填补结果进行比较.最后

3、,采用Ml中的MCMC模型进行了实例应用.结果当数据缺失率低于10%时,用Adhoc方法即可处理;横断面单调缺失数据缺失率低于20%时,条件均数填补法结果较优;纵向数据缺失率低于20%时,LoCF填补结果较优;当数据缺失超过20%时,MI填补效果较优;其中,当分类变量缺失率超过40%时MI填补无效;对于横断面连续变量,缺失率不超过60%时,Ml结果较优;而对于纵向资料连续变量的处理,MI的优势范围相对狭窄,缺失率在20%一40%.不管是横断面资料还是纵向硕士学位论文资料,当连续变量数据任何一种缺失模式的缺失率超过60%时,Ml

4、填补无效.结论研究结果显示,传统的缺失值处理方法在一定范围内仍具有一定优势,但MI发挥优势的空间较大。MI方法能够处理各神类型的随机缺失数据,且填补效率较高。关键词缺失值填补方法模拟技术多重填补法马尔可夭链蒙特卡罗法2硕士学位论文II.AbstractASimulatedComparitiveStudyandApplicationofStatisticalMethodsinDatasetswithMissingValuesObjectiveToexploretheapplicabilityincludingadvanteges

5、anddisadvantagesofmultipleimputation(MI)andothermissing‘datahandlingmethodsinsimulateddatawithmissingvalues.MethodsPropensityscore(PS)andpredictivemeanmatching(PMM)methodsinMIaswelIasAdhocmethdsandconditionalmeanimputationmethodwereusedandcomparedinmonotonemissingpa

6、tternaboutcontiousvadablesincross.sectionaldata.Inmonotonemissingpatternabo.utcategoricalvariablesincross-sectionaldata,thelogisticregressionmethodinMIandAdhocmethodswereempoyedandcompared.MarkovChainMonteCarlo(MCMC)modelinMlcomparedwithAdhocmethodswereusedinarbitra

7、rymissingpatlemaboutcontiousvariablesincross-sectionaIdata.andMCMCmodeIinMIcomparedwithAdhocmethodsandLOCFwereusedinlongitudinalcontiousdatawithmissingvalues.Finally'toimputesomevanableswithmissingvaluesinasurveyofmaternalandchildrenhealth.theMCMCmethodinM1wasemploy

8、ed.,,Result=Adhocmethodsworksasmissingrateislessthan伯%inalIkindsofdatainthisresearch.andthecondRionalmeanimputationmethodisappropnatewhenm

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。