欢迎来到天天文库
浏览记录
ID:27265298
大小:301.29 KB
页数:47页
时间:2018-12-02
《数据缺失时反映变量均值的经验似然置信区间》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、数据缺失时反映变量均值的经验似然置信区间硕士研究生:庞伟才导师:秦永松教授专业:概率论与数理统计摘研究方向:数理统计要年级:2003本文在三种情型下讨论了数据缺失时回归模型反映变量均值的经验似然置信区间一.协变量和反映变量都缺失时回归模型反映变量均值的经验似然置信区间考虑非参数回归模型Y=m(X)+e(1.1)其中X为d维随机协变量,Y为一维反映变量,m(A)为未知回归函数,e为随机误差,且Ee=0,02、i={10Yi不丢失Yi丢失.假设dX与dY相互独立,且(X,Y,e)与(dX,dY)相互独立,此条件蕴含(MCAR)条件,即P(dY=1Y)=P(dY=1)=c1,P(dX=1X)=P(dX=1)=c2,c1,c2为常数.定义几个集合Srr={i:dXi=1,dYi=1},Srm={i:dXi=1,dYi=0}Smr={i:dXi=0,dYi=1},Smm={i:dXi=0,dYi=0}针对数据Yi的不同缺失情况,我们分别给出下列补充(a)当iÎSrrÈSmr,不补充,(b)当iÎSrmÙ,用mn(Xi)=nnXjdYjK()Yjj=1hn3、n)补充Yi,其中K(A)Xi-XjådXi-Xjåj=1dXjjYdK(h为核函数,hn为窗宽,且hn®0当n®¥,(c)当iÎSmm,用Y=nj=1nj=1YjYjYj补充Yi,这样我们得到Y的完全样本为ÙYin=dYiYi+(1-dYi)(dXimn(Xi)+(1-dXi)Y)(1.2)Ù为了避免mn(×)的分母出现零,我们先做一些修正,令Ùdnnj=1XjdYjK(x-XjhnÙÙÙ),gbn(x)=max(gn(x),bn),mbn(x)=Ù^mn(x)gn(x)Ùgbn(x)Ù^其中bn>0,且bn®0当n®¥,用mb4、n(x)修正mn(x)得到Y的完全样本为^ÙYin=dYiYi+(1-dYi)(dXimbn(Xi)+(1-dXi)Y)(1.3)类似于Owen(1988),可得q=EY的对数经验似然比ni=1(1.4)其中ln=ln(q)满足下列方程ni=1^^=0(1.5)记f(A)为X的概率密度函数,g(x)Ap(dXdY=1)f(x),假设下面的条件成立(C.f)f(x)有直到k(>d)阶的有界偏导数.(C.m)m(x)有直到k(>d)阶的有界偏导数.(C.Y)EY2<¥.ådådgn(x)=(nh)åd-1{}^^ln(q)=2ålog1+ln(Yin-5、q)åYin-q1+ln(Yin-q)(C.gmbn)nE((1-dY)dXm(X)I(g(X)6、2=EdX,s2=Ee2.由于非标准的c2分布不能对q作区间估计,故我们需引入调整对数经验似^Ù定理1.2在定理1.1的假设下,如果q为真参数,则ln,ad(q)渐近c12分布.^其中P(c12£ca)=1-a.二.同模型下数据缺失时线性回归模型反映变量均值的经验似然置信区间考虑两独立总体(X1,Y1),(X2,Y2),(Xi,Yi)为Rd´R1上的随机向量,i=1,2,假设它们都有相同的线性回归模型Y=Xtb+e(C.hn)(i)nhn2d(bn2Ù(loglogn))®¥.ln(q)¾L¾®V(q)(1-c1)2c2c2(1-c1)(1-c2)(1-7、c1)(1-c2)21V(q)=c11122)Var(m(X))然比ln,ad(q).见(第5页)即P(ln,ad(q)£ca)=1-a+o(1),(2.1)其中b为d维未知常向量,e为随机误差,且Ee=0,08、Xit2b补充Yi2.类似于Owen(1988),可得q=EY2的
2、i={10Yi不丢失Yi丢失.假设dX与dY相互独立,且(X,Y,e)与(dX,dY)相互独立,此条件蕴含(MCAR)条件,即P(dY=1Y)=P(dY=1)=c1,P(dX=1X)=P(dX=1)=c2,c1,c2为常数.定义几个集合Srr={i:dXi=1,dYi=1},Srm={i:dXi=1,dYi=0}Smr={i:dXi=0,dYi=1},Smm={i:dXi=0,dYi=0}针对数据Yi的不同缺失情况,我们分别给出下列补充(a)当iÎSrrÈSmr,不补充,(b)当iÎSrmÙ,用mn(Xi)=nnXjdYjK()Yjj=1hn
3、n)补充Yi,其中K(A)Xi-XjådXi-Xjåj=1dXjjYdK(h为核函数,hn为窗宽,且hn®0当n®¥,(c)当iÎSmm,用Y=nj=1nj=1YjYjYj补充Yi,这样我们得到Y的完全样本为ÙYin=dYiYi+(1-dYi)(dXimn(Xi)+(1-dXi)Y)(1.2)Ù为了避免mn(×)的分母出现零,我们先做一些修正,令Ùdnnj=1XjdYjK(x-XjhnÙÙÙ),gbn(x)=max(gn(x),bn),mbn(x)=Ù^mn(x)gn(x)Ùgbn(x)Ù^其中bn>0,且bn®0当n®¥,用mb
4、n(x)修正mn(x)得到Y的完全样本为^ÙYin=dYiYi+(1-dYi)(dXimbn(Xi)+(1-dXi)Y)(1.3)类似于Owen(1988),可得q=EY的对数经验似然比ni=1(1.4)其中ln=ln(q)满足下列方程ni=1^^=0(1.5)记f(A)为X的概率密度函数,g(x)Ap(dXdY=1)f(x),假设下面的条件成立(C.f)f(x)有直到k(>d)阶的有界偏导数.(C.m)m(x)有直到k(>d)阶的有界偏导数.(C.Y)EY2<¥.ådådgn(x)=(nh)åd-1{}^^ln(q)=2ålog1+ln(Yin-
5、q)åYin-q1+ln(Yin-q)(C.gmbn)nE((1-dY)dXm(X)I(g(X)6、2=EdX,s2=Ee2.由于非标准的c2分布不能对q作区间估计,故我们需引入调整对数经验似^Ù定理1.2在定理1.1的假设下,如果q为真参数,则ln,ad(q)渐近c12分布.^其中P(c12£ca)=1-a.二.同模型下数据缺失时线性回归模型反映变量均值的经验似然置信区间考虑两独立总体(X1,Y1),(X2,Y2),(Xi,Yi)为Rd´R1上的随机向量,i=1,2,假设它们都有相同的线性回归模型Y=Xtb+e(C.hn)(i)nhn2d(bn2Ù(loglogn))®¥.ln(q)¾L¾®V(q)(1-c1)2c2c2(1-c1)(1-c2)(1-7、c1)(1-c2)21V(q)=c11122)Var(m(X))然比ln,ad(q).见(第5页)即P(ln,ad(q)£ca)=1-a+o(1),(2.1)其中b为d维未知常向量,e为随机误差,且Ee=0,08、Xit2b补充Yi2.类似于Owen(1988),可得q=EY2的
6、2=EdX,s2=Ee2.由于非标准的c2分布不能对q作区间估计,故我们需引入调整对数经验似^Ù定理1.2在定理1.1的假设下,如果q为真参数,则ln,ad(q)渐近c12分布.^其中P(c12£ca)=1-a.二.同模型下数据缺失时线性回归模型反映变量均值的经验似然置信区间考虑两独立总体(X1,Y1),(X2,Y2),(Xi,Yi)为Rd´R1上的随机向量,i=1,2,假设它们都有相同的线性回归模型Y=Xtb+e(C.hn)(i)nhn2d(bn2Ù(loglogn))®¥.ln(q)¾L¾®V(q)(1-c1)2c2c2(1-c1)(1-c2)(1-
7、c1)(1-c2)21V(q)=c11122)Var(m(X))然比ln,ad(q).见(第5页)即P(ln,ad(q)£ca)=1-a+o(1),(2.1)其中b为d维未知常向量,e为随机误差,且Ee=0,08、Xit2b补充Yi2.类似于Owen(1988),可得q=EY2的
8、Xit2b补充Yi2.类似于Owen(1988),可得q=EY2的
此文档下载收益归作者所有