资源描述:
《缺失数据下两样本差异指标的经验似然推断》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、广西师范大学硕士学位论文缺失数据下两样本差异指标的经验似然推断姓名:张俊超申请学位级别:硕士专业:概率论与数理统计指导教师:秦永松20070401缺失数据下两样本差异指标的经验似然推断学科专业:概率统计指导教师:秦永松摘要研究方向:数理统计研究生:张俊超(2004010589)总体差异检验在许多实际应用中是相当广泛的,例如医学研究。在本文中,我们利用概率理论来判定两样本间的差异所具有的性质。在实际中,我们经常得到如下不完全样本:样本(Xi,äXi)(i=1,,n)和样本(Yi,äYi)(j=1,,m),其中样本Xi(i=1,,n)和样本Yj(j=1,,m)都缺
2、失,即0ximissing1xinomissing01yjmissingyjnomissing(i=1,,n;j=1,,m)本文中,我们假定X,Y都是完全随机缺失(MCAR)(参见LittleandRubin(2002)),即X、Y的缺失满足P(äX=1
3、X)=P(与x无关的常数)、P(äY=1
4、Y)=Py(与y无关的常数),且(X,äX),(Y,äY)是相互独立的。通常的理论推断在这些有缺失样本的情形下不能直接应用,处理不完全样本的基本方法是对那些缺失的样本观测值进行补足,再应用标准统计方法将其看作实际观察中的完全数据处理,补足方法主要有固定补足和
5、随机补足两种(参见Rao(1996))。本文在第一章中假定xi,i=1,,n,和yj,j=1,,m,是来自总体x,y中的简单随机样本,x∼F(x),y∼G(y),F(i)和G(i)都未知。nmiji=1j=1个观测值中未缺失个体的集合;snx,smy分别表示X和Y的n和m个观测值中缺失个体的集合。∗作为X的补足数据.类似可得y∗j。令=ä+(1−äyI,j=äyjyj+(1−äyj)y*i=1,…,nj=1,…,m表示X和Y补足后的完全数据样本。令è0,è1分别是关于F和G的指标,且∆=è1−è0。设已知下列信息:E(ù1(x,è0,∆))=0,E(ù2(y,è0,
6、∆))=0,其中ùi,i=1,2,为已知函数。考虑似然函数:I(1),äyj=令rx=∑äx,nx=n−rx;ry=∑äy,my=m−ry。分别用srx,sry表示对X,Y的n和m,i∈s,i∈s此时用如下方法补足:记{xinx}为从{xirx}中独立随机抽取的nx个样本,将其xxI,ixixixi)xi*jnmi=1j=1(2)−nij考虑关于∆的经验似然比统计量:R(∆)=supnmj=1è(3)其中p1,,pn,q1,,qm满足约束条件pi>0,i=1,qj>0,j=1,,n,,m,nni=1i=1mmj=1j=1(4)(5)由(3)-(
7、5),利用拉格朗日乘子法,可得对数经验似然比统计量为:nmi=1j=1其中ëj(è),j=1,2由下式确定n11I,im22I,j1nù(x,è,∆)1mù(y,è,∆)(6)(7)令=0,得如下经验似然方程:nm+ëni=11+ë1(è)ù1(xI,i,è,∆)nj=11+ë2(è)ù2(yI,j,è,∆)=0(8)其中á1(xI,i,è,∆)=∂ù1(xI,i,è,∆)/∂è,á2(yI,j,è,∆)=∂ù2(yI,j,è,∆)/∂è。此处假定∂ù1(xI,i,è,∆)/∂è和∂ù2(yI,j,è,∆)/∂è都存在。首先给出如下正则条件:1.è0∈Ω,Ω
8、为开区间。22
9、ù13(x,è,∆)
10、在è0的某邻域内以某可积函数G1(x)作为上界。
11、á2(y,è,∆)
12、和
13、ù23(y,è,∆)
14、在è0的某邻域内以某可积函数G2(x)作为上界。3.nm→k(n,m→∞),且00,i=1,…,n,∑pi=1;qj>0,j=1,…,m,∑qj=1,则(2
15、)的最大值是nm−m。∏npi∏mqj=supR(∆,è)∑pi=1,∑più1(xI,i,è,∆)=0∑qj=1,∑qjù2(yI,j,è,∆)=0logR(∆,è)=−∑log{1+ë1(è)ù1(xI,i,è,∆)}−∑log{1+ë2(è)ù2(yI,j,è,∆)}∑=i11+ë(1è)ùI,i(x,è,∆)=0∑j=11+ë(2è)ùI,j(y,è,∆)=0∂logR(∆,è)∂è11(è)∑2.Eù1(x,è0,∆)>0,Eù2(y,è0,∆)>0,á1(x,è,∆),á2(y,è,∆)连续,
16、á1(x,è,∆)
17、和定理1若条件1-3满足