资源描述:
《分数填补下两总体分位数差异的半经验似然推断》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广西师范大学硕士学位论文分数填补下两总体分位数差异的半经验似然推断姓名:张正家申请学位级别:硕士专业:概率论与数理统计指导教师:秦永松20080301广西师范大学硕士学位论文:分数填补下两总体分位数差异的半经验似然推断分数填补下两总体分位数差异的半经验似然推断年级:2005级专业:概率论与数理统计研究方向:数理统计导师:秦永松教授研究生:张正家摘要缺失数据现象在现实生活中常有发生,如在民意调查、医学研究和市场调查等领域常常由于各种原因而产生带有缺失数据的不完全样本,在这种情况下通常用于完全样本情形的统计方法往往不能直接应用,需要预先对数据进行必要的处理.缺失数据情形的统计推断是
2、当今统计界中的一个重要且热门的研究领域(Little&Robin,Statisticalanalysiswithmissingdata[M].NewYork:JohnWiley&Sons2002.).最早用于解决缺失数据的方法是Complete-Case方法,它是将所有数据缺失的项删除,然后对余下的项构成的“完全”样本按通常的统计方法进行统计推断.但这种方法减小了样本容量,容易导致数据发生偏离而导出错误的结论.现在处理不完全样本的常用方法是填补法,它是对缺失值进行补充,得到“完全”样本,再按通常用于完全样本情形的统计方法进行统计推断.这种方法分为两类
3、
4、固定填补法和随机填补法,
5、由于固定填补法对均值以外的参数进行统计推断时会产生不相合估计,常用随机填补法来填补缺失数据.总体差异比较是市场调查、经济和教育领域经常遇到的课题,秦永松和赵林城(Semi-parametriclikelihoodcon¯denceintervalsforvariousdi®erencesoftwopopu-lations[J].StatisticsandProbabilityLetters,1997,33(2):135-143;两总体分位数差异的经验似然比置信区间[J].数学年刊(A辑),1997,18(6):687-694;两样本分位数差异的半经验似然比检验[J].应用数学学
6、报,1998,21(1):103-112;Empiricallikelihoodratiocon¯denceintervalsforvariousdi®erencesoftwopopulations[J].SystemScienceandMathematicalSciences,2000,13:23-30.)在完全样本情形系统讨论了各种总体差异指标的经验似然置信区间的构造.张俊超(缺失数据下两样本差异指标的经验似然推断[D].桂林,广西师范大学,2007.)在MCAR缺失机制下用单一随机填补法(分数填补法的一个特例)填补缺失的数据,并获得了两总体半参数模型分位数差异的经验似然置
7、信区间.考虑到存在填补方差偏大的问题,为了进一步减少填补方差,本文第二章在MCAR缺失数据情形用分数填补法获得了“完全”样本,证明了分位数差异的半经验似然比统计量的极限分布为加权卡方分布,并据此构造了一非参数总体与一参数总体分位数差异的半经验似然置信区间,由此提高了置信区间的覆盖精度.考虑到MAR缺失机制的限制条件比MCAR缺失机制弱且在实际应用中更容易得到满足,本文在第三章中将第二章的主要结果推广到非参数总体服从MAR缺失机制而参数总体服从MCAR缺失机制的混合缺失机制情形.该章用分数填补法获得“完全”样本,并构造了一非参数总体与一参数总体分位数差异的半经验似然置信区间.{i
8、{广西师范大学硕士学位论文:分数填补下两总体分位数差异的半经验似然推断本文的特色体现在以下两个方面:1.在MCAR缺失机制下的不完全数据情形,采用分数填补法补足缺失数据,并构造了一非参数总体与一参数总体分位数差异的半经验似然置信区间.而通常的随机填补法是分数填补法的特例,当分数填补法中的重复填补次数增大时,可以逐步减少填补方差,且由模拟结果知平均区间长度逐渐减小并趋于某个平稳值.与单一随机填补法比较,分数填补法可以提高置信区间的覆盖精度.2.在混合缺失机制下的不完全数据情形,采用分数填补法补足缺失数据,并构造了一非参数总体与一参数总体分位数差异的半经验似然置信区间.MAR缺失机
9、制比MCAR缺失机制的限制条件更弱且更易满足.关键词:缺失数据;缺失机制;分位数差异;分数填补法;经验似然;置信区间{ii{广西师范大学硕士学位论文:分数填补下两总体分位数差异的半经验似然推断Semi-empiricalLikelihoodInferenceforQuantileDi®erencesofTwoPopulationswithMissingDatabyUsingFractionalImputationGrade:2005Major:ProbabilityandStatistics