欢迎来到天天文库
浏览记录
ID:27548800
大小:1.98 MB
页数:43页
时间:2018-12-04
《非参数统计ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、符号检验法符号检验符号检验在定性数据分析中的应用目录成对数据的比较问题符号检验我们知道表示数据的中心位置(或平均大小)的方法有平均数(包括切尾平均数)、中位数和众数。在参数数据分析方法中,总体的中心位置常用总数的均值表示,所以关于中心位置的检验问题就是关于均值的检验问题。例如,在总体分布服从正态分布时,使用t检验方法检验均值。而在非参数数据分析方法中,总体的中心位置常用中位数表示,所以关于中心位置的检验问题就是关于中位数的检验问题。现在由我们第二组的成员(喻江红、张茜、年先美、刘亚飞)和大家一起来讨论中位数检验问题的符号检验问题。下面请大家看到P28例3.1用我们之前学过的中位数的一般计算
2、方法,得出这50名高级技师年收入的中位数为23276,超过了全市高级技师年收入的中位数21700.那么总体中该行业高级技师年收入的中位数23276是否比全市高级技师年收入的中位数21700高?原假设H0:me=21700备择假设H1:me>21700前面中位数的计算太过于复杂,而符号检验的计算很简单,只需将每一个样本数据与21700比较,然后计算一下,有多少个样本数据大于21700.本例中由32个样本数据大于221700.不妨假设P(Xme)=1/2,其中X为该行业高级技师的年收入。于是若me>21700,则P(X<21700)217003、)>P(X>me)=1/2.所以一般来说,观察到的大于21700的样本数据的个数比较多,而小于21700的样本数据的个数比较少,即S+比较大。因而我们拒绝原假设H0:me=21700,从而认为总体中该行业高级技师的年收入的中位数me>21700.中位数的符号检验问题的一般提法如下.样本x1,x2,....,xn独立同分布,总体为X.符号检验对于总体X的分布不妨作假设:P(Xme)=1/2.由此可见P(X=me)=0符号检验问题的原假设和备择假设有三种情景:原假设H0me=me0备择假设H1me>me0由于P(X=me)=0,所以不妨假设样本单元x1,x2,.....xn都4、不等于me0。符号检验的检验统计量为(3.1)记号“#”表示计数S+也可以等价的表示为(3.2)若me>me0,则P(Xme)>P(X>me0)=1/2,即S+比较大,此时拒绝原假设H0:me=me0,而认为me>me0.由于在me=me0时,S+~b(n,1/2),所以检测的水平为α的拒绝域为S+>=c,其中c满足条件:(3.3)也可以通过p值来完成检验P值等于二项分布b(n,1/2)的随机变量大于等于S+的概率:P(b(n,1/2)>=S+)。P值越小,表示S+越大。若p值≤α,则拒绝原假设H0;若p值>α,则接受原假设H0.由Excel可以5、算得p值。如果在excel中输入“=binomdist(k,n,p,1)”,就可以求得累计概率P(b(n,p)≤k)的值;如果在excel中输入“=binomdist(k,n,p,0)”,则求得概率P(b(n,p)=k)的值。所以在excel中输入“=binomdist(S+—1,n,0.5,1)”就可以得到符号检验的p值,即P(b(n,1/2)≥S+)的值。前面第二章我们已经用到了excel,大家可以回去操作一下,计算一下例3.1,可以算得p值为P(b(50,1/2)≥32)=0.03245.由于p值较小,我们可以拒绝原假设,级认为在总体中该行业高级技师年收入的中位数me比全市高级技师年6、收入的中位数21700高。若根据观察值所得的S+拒绝原假设,那么p值也可以用来度量犯第一类错误的概率。如果me<me0P(X<me0)>P(X<me)=1/2P(X>me0)>P(X>me)=1/2一般来说,这时观察到的大于me0的样本数据的个数比较少,小于me0的样本数据的个数比较多,及S+比较小∴我们在S+比较小的时候拒绝原假设H0:me=me0,而认为me<me0.由于在me=me0时,S+~b(n,1/2),∴检验的水平位α的拒绝域为S+≤d,期中d满足条件:(3.4)因为在p=1/2时二项分布b(n,p)是对称分布,所以(3.3)式的c和(3.4)的d有这样的关系:d=n-c也可7、以通过p值完成检验的程序:由于在S+比较小的时候拒绝原假设∴p值等于二项分布b(n,1/2)的随机变量小于等于S+的概率:P(b(n,1/2)≤S+).如果p值≤α,则在水平α下拒绝原假设,认为me<me0;如果p值>α,则在水平α下不拒绝原假设.如果me=me0,则P(X<me0)=P(X>me0)=1/2一般来说,这时观察到的大于me0的样本数据的个数与小于me0的样本数据个数没有太大的差别,即S+不是很大,也不是很
21700
3、)>P(X>me)=1/2.所以一般来说,观察到的大于21700的样本数据的个数比较多,而小于21700的样本数据的个数比较少,即S+比较大。因而我们拒绝原假设H0:me=21700,从而认为总体中该行业高级技师的年收入的中位数me>21700.中位数的符号检验问题的一般提法如下.样本x1,x2,....,xn独立同分布,总体为X.符号检验对于总体X的分布不妨作假设:P(Xme)=1/2.由此可见P(X=me)=0符号检验问题的原假设和备择假设有三种情景:原假设H0me=me0备择假设H1me>me0由于P(X=me)=0,所以不妨假设样本单元x1,x2,.....xn都
4、不等于me0。符号检验的检验统计量为(3.1)记号“#”表示计数S+也可以等价的表示为(3.2)若me>me0,则P(Xme)>P(X>me0)=1/2,即S+比较大,此时拒绝原假设H0:me=me0,而认为me>me0.由于在me=me0时,S+~b(n,1/2),所以检测的水平为α的拒绝域为S+>=c,其中c满足条件:(3.3)也可以通过p值来完成检验P值等于二项分布b(n,1/2)的随机变量大于等于S+的概率:P(b(n,1/2)>=S+)。P值越小,表示S+越大。若p值≤α,则拒绝原假设H0;若p值>α,则接受原假设H0.由Excel可以
5、算得p值。如果在excel中输入“=binomdist(k,n,p,1)”,就可以求得累计概率P(b(n,p)≤k)的值;如果在excel中输入“=binomdist(k,n,p,0)”,则求得概率P(b(n,p)=k)的值。所以在excel中输入“=binomdist(S+—1,n,0.5,1)”就可以得到符号检验的p值,即P(b(n,1/2)≥S+)的值。前面第二章我们已经用到了excel,大家可以回去操作一下,计算一下例3.1,可以算得p值为P(b(50,1/2)≥32)=0.03245.由于p值较小,我们可以拒绝原假设,级认为在总体中该行业高级技师年收入的中位数me比全市高级技师年
6、收入的中位数21700高。若根据观察值所得的S+拒绝原假设,那么p值也可以用来度量犯第一类错误的概率。如果me<me0P(X<me0)>P(X<me)=1/2P(X>me0)>P(X>me)=1/2一般来说,这时观察到的大于me0的样本数据的个数比较少,小于me0的样本数据的个数比较多,及S+比较小∴我们在S+比较小的时候拒绝原假设H0:me=me0,而认为me<me0.由于在me=me0时,S+~b(n,1/2),∴检验的水平位α的拒绝域为S+≤d,期中d满足条件:(3.4)因为在p=1/2时二项分布b(n,p)是对称分布,所以(3.3)式的c和(3.4)的d有这样的关系:d=n-c也可
7、以通过p值完成检验的程序:由于在S+比较小的时候拒绝原假设∴p值等于二项分布b(n,1/2)的随机变量小于等于S+的概率:P(b(n,1/2)≤S+).如果p值≤α,则在水平α下拒绝原假设,认为me<me0;如果p值>α,则在水平α下不拒绝原假设.如果me=me0,则P(X<me0)=P(X>me0)=1/2一般来说,这时观察到的大于me0的样本数据的个数与小于me0的样本数据个数没有太大的差别,即S+不是很大,也不是很
此文档下载收益归作者所有