资源描述:
《第4章两独立样本的非参数检验.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第三章两独立样本的非参数检验在单样本位置问题中,人们想要检验的是总体的中心是否等于一个已知的值.但在实际问题中,更受注意的往往是比较两个总体的位置参数;比如。两种训练方法中哪一种更出成绩,两种汽油中哪一个污染更少,两种市场营销策略中那种更有效等等.作为一个例子.我国沿海和非沿海省市区的人均国内生产总值(GDP)的1997年抽样数据如下(单位为元).沿海省市区为(Y1,Y2,…,Y12):150441227053457730222758447945581366834951340815500而非沿海的为对(x1,x2,…,x18):516342204259646838813
2、715403251224130376320933715273233132901374837315167人们想要知道沿海和非沿海省市区的人均GDP的中位数是否一样.这就是检验两个总体的位置参数是否相等的问题.假定代表两个独立总体的随机样本(Y1,Y2,…,Y12)和(x1,x2,…,x18),则问题归结为检验它们总体的均值(或中位数)的差是否相等,或是否等于某个已知值.换言之,即检验:;::;::;:在正态假定下,这些问题化为:t检验并不稳健,在不知总体分布时,应用t检验时会有风险的。3。1Brown-Mood中位数检验令沿海地区的人均GDP的中位数为MX,而内地的为MY
3、.零假设为:;:显然,在零假设下,中位数如果一样的话,它们共同的中位数,即这(12十18)=30个数的样本中位数(记为此),应该对于每一列数据来说都处于中间位置.也就是说,(Y1,Y2,…,Y12)和(x1,x2,…,x18)中大于或小于的样本点应该大致一样多,计算他们的混合样本中位数为4690。5。在用两个样本和比较之后得到各个样本中大于和小于它的数目XY总和观察值大于Mxy的数目11415观察值小于Mxy的数目11415121830可以看出上面的表是一个2x2列联表。由初等概率可知,对于一般的2x2列联表。XY总和>MxyabT=a+b<Mxym—an—b(m+n)
4、—(a+b)总和mnm十n在原假设成立的条件下,这个结果有一点象超几何分布。A=在样本中大于的样本点数,则取在样本中大于的样本点数作为检验的统计量,则应该不大不小,如果太大或太小,则应该怀疑原假设。假设检验的统计量P值AAA2(,)总体容量:30总体中成功的次数:15样本容量:12样本中成功的次数:11==0。000237+0。00000526=0。000242==4。5/1.34=3.36假设检验的统计量P值A=0。00242§3。2Wlicoxon(Mann-Whitney)秩和检验在前面一节,比较两个总体的中位数的检验时,只利用了样本大于或小于共同中位数的数目,如
5、同前面的单独符号秩检验一样,只有方向的信息,没有差异大小的信息。作为单样本的Wlicoxon秩和检验的推广,下面我们讨论两个样本的Wlicoxon秩和检验.设(X1,X2,X3,…Xm)和(Y1,Y2,…,Yn)分别为两个连续总体Fx和Fy中随机抽取出来的样本,我们关心两个总体是否有相同的分布形状,或者他们的中位数是否相等.为了对假设作出判定,如果H0为真,那么将m个x、n个y的数据,按数值的相对大小从小到大排序,X、y的值应该期望被很好地混合,这m十n=N个观察值能够被看作来自于共同总体的一个单一的随机样本.若大部分的y大于X,或大部分的x大于y,将不能证实这个有序的
6、序列是一个随机的混合,将拒绝X、y来自一个相同总体的零假设。在X、y混合排列的序列中,X占有的位置是相对于y的相对位置,因此等级或秩是表示位置的一个极为方便的方法。在x、y的混合排列中,等级1是最小的观察值,等级N是最大的。若X的等级大部分大于y的等级,那么数据将支持H1:Mx〉My,而x的等级大部分小于y的等级,则数据将支持H1:Mx7、,y2,…,yn,N=m+n。令使把所有的y观测值与x观测值做比较后,x大于y的个数。令使把所有的x观测值与y观测值做比较后,y大于x的个数有我们来说明两个公式的成立.如仅仅将x1,x2,…,xn排序后,其秩和为:m(m+1)/2。比如某个Xi是最小的,即.但是如果是两个总体的合在一起排序,不妨假设故x大于y的个数为2,所以Xi的混合秩为。考虑所有的,则可得上面两式。可以证明:则当n足够大时,假设检验的统计量(k)P值或或2用前面的例题作为一个例子.我国沿海和非沿海省市区的人均国内生产总值(GDP)的1997年抽样数据如下(单位为元).沿