基于DA插补法的线性回归模型系数估计值的模拟研究-论文.pdf

基于DA插补法的线性回归模型系数估计值的模拟研究-论文.pdf

ID:54925925

大小:434.79 KB

页数:6页

时间:2020-05-04

基于DA插补法的线性回归模型系数估计值的模拟研究-论文.pdf_第1页
基于DA插补法的线性回归模型系数估计值的模拟研究-论文.pdf_第2页
基于DA插补法的线性回归模型系数估计值的模拟研究-论文.pdf_第3页
基于DA插补法的线性回归模型系数估计值的模拟研究-论文.pdf_第4页
基于DA插补法的线性回归模型系数估计值的模拟研究-论文.pdf_第5页
资源描述:

《基于DA插补法的线性回归模型系数估计值的模拟研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第29卷第3期统计与信息论坛2014年3月Vo1.29No.3Statistics&InformationForumMar.。2014【统计理论与方法】基于DA插补法的线性回归模型系数估计值的模拟研究杨贵军,骆新珍(天津财经大学中国经济统计研究中心,天津300222)摘要:DataAugmentation(DA)插补法是最常用的MCMC多重插补法之一。利用模拟方法研究基于DA插补法的线性回归模型的系数估计值,分析估计值的统计性质受无回答机制、无回答率和插补重数的影响。模拟结果显示:在完全随机无回答机制下,选择较小插补重数常常会得到较好的回归系数估计值;在随机无回答机制下,随着无

2、回答率增大而选择更大插补重数往往会得到更好的回归系数估计值;在非随机无回答机制下,选择更大插补重数并不一定总会得到更好的回归系数估计值。关键词:DA多重插补法;无回答机制;无回答率;插补重数中图分类号:F224.0:0212.2文献标志码:A文章编号:1OO7~3116(2014)O3一O0O3—06在不追加样本数据的前提下,插补法是目前解决无一、引言回答的主要方法[7]5船。插补法包括单重插补法和无回答是影响调查数据质量的重要因素。调查多重插补法。单重插补法给出无回答的单个插补数据无回答包括调查单元无回答和调查项目无回值;多重插补法给出同一无回答的多个插补值,插补答。单元无回

3、答是被调查者没有回答任何调查项值的个数称为插补重数。利用多重插补法,不仅给目;项目无回答是被调查者回答部分而不是全部的出参数的估计值,还给出其误差描述。常用的单重调查项目。在抽样调查实践中,无回答产生的原因插补法有冷卡插补、热卡插补、均值插补、回归插补、很多,可能是被调查者不回答调查问题,也可能是调最近邻插补[8-10]。Rubin提出EM插补法[11]卜船;查员遗漏调查项等等。无回答在社会调查中普遍存Schafer将MCMC(MarkovChainMonteCarlo)的在,而且很难避免。DA算法用于多重插补,称为DA插补法E]。SAS、无回答可能会造成回归模型系数估计的系统

4、偏S—Plus和NORM等软件都能完成多重插补。国差,这种偏差不会随样本量增大而减小,采用传统统内的学术文献侧重于多重插补法的应用,目前DA计方法很难给出满意结果。Graham认为对无回答插补法的很多统计性质还在进一步研究中。进行简单替代或删除,并不总能满足统计应用的需Rubin引人数据缺失机制(为叙述方便将其称要[1]3;调查之前严谨细致的预防措施只能降低无为无回答机制)E13]弛,试图利用已观测数据分析无回答率,并不总能彻底解决无回答E。]盯。;采用抽回答的统计规律,并将无回答分为三种机制:完全随样后再追加调查单元的方法能较好解决无回答,但机无回答机制、随机无回答机制、非随

5、机无回答机会导致调查费用增加和调查时间延长[3;把无回答制_1。]2。。。在完全随机无回答机制下,无回答的看作随机现象的解决办法只适用于分析某些类型的发生不依赖于已观测数据而也不依赖于无回答的原无回答[一。有数据;在随机无回答机制下,无回答的发生仅依赖插补法是对无回答单元和无回答项目的估计。于已观测数据,并不依赖于无回答的原有数据;在非收稿日期:2O13~O9—24;修复日期:2O13—12—24基金项目:国家社会科学基金重大项目《国家统计数据质量管理研究》(O9&ZDO4O);教育部留学回国人员科研启动基金项目《两阶段设计的若干问题研究》作者简介:杨贵军,男,黑龙江哈尔滨人,

6、理学博士,教授,研究方向:统计学;骆新珍,男,甘肃永登人,硕士生,研究方向:统计学。3统计与信息论坛随机无回答机制下,无回答的发生依赖于无回答的如下:先给参数一(/1,∑)赋予初始值(o)=(三∞,,原有数据,或依赖于其它的未观测数据。无回答机∑∞),假定经过£一1次迭代之后,参数的估计值制是影响插补法适用性的重要因素,无回答机制不同插补法的使用也不一样。为o一”:(五“一¨,∑0一")。笔者利用模拟方法研究基于DA插补法的多元线插补步:从模型YNR~N(五”fyR,∑I性回归模型系数估计值的统计性质,分析无回答机制、YR)中,抽取随机数作为YNR的插补值。插补重数、无回答率对

7、估计值的影响。无回答是指多后验步:从模型∑}(y尺,)~w(一1,(72元线性回归模型的响应变量无回答,本文选择的插补—1)S0)中,抽取随机数作为∑的估计值∑0’;从模重数分别为5、15、25、35、45;无回答机制包括完全随机无回答机制、分别依赖于不同解释变量的随机无回答型l(∑“,YR,’)~N(‘,∑/n)中,抽取随机机制、非随机无回答机制;无回答率分别选择5、数作为的估计值五0’,其中Y0’为(,YR)的样本15、25、35、45。基于模拟结果,进一步讨论在均值,So为(,yR)的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。