资源描述:
《非参数假设检验课件》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、非参数检验基本概念:前面介绍的检验方法首先假定总体服从特定的已知分布(如正态分布),然后对分布的参数(如均数)作检验。这类检验方法称为参数检验。今天介绍的检验方法不对总体的分布作严格假定,检验不针对特定的参数,而是模糊地对总体的分布形态作检验。这类检验称非参数检验,由于其对总体分布不作严格假定,所以又称任意分布检验。⑴非参数检验的优点:a.不受总体分布的限制,适用范围广。b.适宜定量模糊的变量和等级变量。c.方法简便易学。(2)缺点:对于适合用参数检验的资料,如用非参数检验会造成信息的丢失,犯第II类错误的概率增大,造成检验功效下降。分布拟和检验在实际问题中,有时不
2、能预先知道总体所服从的分布,而需要根据样本值(xPx2,..,xn)来判断总体是否服从指定的分布。也就是在给定的显著性水平下,对假设H0:F(x)=^(x)・H]:F(x)工代⑴其中代(对为已知的具有明确表达式的分布函数。这种假设检验通常称为分布的拟和检验。它是非参数检验中较为重要的一种。在这里,我们主要介绍分布拟和检验的2两种一般性方法:z拟和检验和Kolmogorov-Smirnov的Dn检验。一拟和检验1、多项分布的/检验法(离散情形)假设条件:设总体是仅取m个可能值的离散型随机变量。设X的可能值是1…,m,且mP(X=z)=Pii=12・・・N工Pi9i=l
3、的个Nj:表示样本(绐,禺,…,x”)中取值为数,则我们可以得到随机向量m9且1=1的,他,…,九)口D严n(1)假设检验:H():Pi=Ao(i=l,2v..,m)其中卩。是已知数。(2)构造统计量Hi:Pi丰PiO(皮尔逊统计量)9定理:当弘为真时,皮尔逊统计量乙渐进服从自由度为m・l的X分布。(3)确定拒绝域八加一1)}2、当总体X不具有多项分布.(1)假设检验Hq:F(x)=F0(x).Hx:F(x)^F0(x)其中E")为已知的具有明确表达式的分布函数。我们将X的可能取值范围R分成m个互不相交的区间:&—),,九=[佥_1,am(这些区间不一定长度相等。且
4、氐可为-8,缶可为+°°)。以叫表示样本观测值Xi,X2、,禺中落入九的频数,称之为观测频数,显然有m若N产",而事件{XgA}在n次观测中发生的频率为Nj%。我们知道,当H。为真时,p(XG4)=Fo(ai)-Fo(ai-1)=pi0i=l,2,…,k于是得到在H。为真时,容量为n的样本落入区间人的理论频数为呱,即,当n充分大时,叫与We的差异不应太大。(2)构造统计量i=l(N)np(2昭0(3)确定拒绝域3、分布函数中含有未知参数的检验法前面讨论了多项分布和分布形式完全确2定情形的Z检验方法。但在许多场合,假设原假设Ho只确定了总体分布的类型,而分布中含有未知
5、参数&2,…,彳。(1)假设检验H°:F(x)=F°Qc;%,…:尸⑴工化(疋&1,&2,…,0)我们首先用讥…O的极大似然估计%…彳代替F。中的未知参数,再按情况2的办法进行检验,但这时所示的统计量的渐近分布将是zXm-r-Y)拒绝域{力注朮,加-厂-1)}注意:/拟和优度检验方法使用时,必须注意n要足够大,以及"卩不太小这两个条件。一般要求样本容量n不小于50,以及每个®,都不小于5,而且®,最好在10以上,否则应当适当的合并区间,使昭满足这个条件。二、Kolmogorov-Smirnov检验前面我们讨论的拟合检验虽能对任何类型的未知分布进行检验,但它依赖于区间
6、的划分,实际上仅仅检验了是否有AF(cii)-F(az-i)=Fo(e)-Fo(%-i)=£i=・・・k故有可能接受到不真的H。有必要再来探讨一种更精确的检验法,本段来讨论如何用样本的经验分布函数来作分布函数的拟合检验一—Kolmogorov-Smirnov检验。利用这种检验方法,总体的分布必须假定为连续的。回顾:设总体X的分布函数F(x)是连续的,从中抽取容量为n的样本,其经验分布函数为Fn(x),若记2=上岌/Q)"⑴,则根据科列汶科定理:P{limQ=0}=1Kolmogorov进一步讨论了统计量D)的精确分布和极限分布。(具体公式见书《应用统计基础》P15
7、5定理27华南理工大学出版社)因此,当耳):F(Q=F°(x)为真时,Dn=sup代⑴—坨⑴—oocHQ为真}=Kolmogorov检验法步骤:设总体X〜F(x)未知,从中抽取样本观察值Ho:F(x)=/^(x);a:F(Q工代(兀)其中Fo(x)为已知的连续分布函数将X】,……,禺由小到大排序为x⑴W……Wx(n)设所作经验分布函数为Fn(x),取检验统计量Dn:当H。为真时,Dn具有如定理2所述的精确分布和极限分布,H。不真时,Dn便有偏大的趋势,因此,