资源描述:
《SAS讲义第二十七课符号检验和Wilcoxon符号秩检验.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二十七课符号检验和Wilcoxon符号秩检验在统计推断和假设检验中,传统的检验统计量都叫做参数检验,因为它们都依赖于确定的概率分布,这个分布带有一组自由的参数。参数检验被认为是依赖于分布假定的。通常情况下,我们对数据进行分析时,总是假定误差项服从正态分布,这是人们易于接受的事实,因为正态分布的原始出发点就是来自于误差分布,至于当样本相当大时,数据的正态近似,这是由于大样本理论所保证的.但有些资料不一定满足上述要求,或不能测量具体数值,其观察结果往往只有程度上的区别,如颜色的深浅、反应的强弱等,此时就不适用参数检验的方法,而只能用非参数统计方法(non—parametricstatist
2、icalanalysis)来处理。这种方法对数据来自的总体不作任何假设或仅作极少的假设,因此在实用中颇有价值,适用面很广。一、单样本的符号检验符号检验(signtest)是一种最简单的非参数检验方法。它是根据正、负号的个数来假设检验。首先需要将原始观察值按设定的规则,转换成正、负号,然后计数正、负号的个数作出检验。该检验可用于样本中位数和总体中位数的比较,数据的升降趋势的检验,特别适用于总体分布不服从正态分布或分布不明的配对资料,有时当配对比较的结果只能定性的表示,如试验前后比较结果为颜色从深变浅、程度从强变弱,成绩从一般变优秀,即不能获得具体数字,也可用符号检验,例如用正号表示颜色从深
3、变浅,用负号表示颜色从浅变深。用于配对资料时,符号检验的计算步骤为:首先定义成对数据指定正号或负号的规则,然后计数正号的个数及负号的个数,由于在具体比较配对资料时,可能存在配对资料的前后没有变化,或等于假设中的中位数,此时仅需要将这些观察值从资料中剔除,当然样本大小也随之减少,故修正样本大小。当样本较小时,应使用二项分布确切概率计算法,当样本较大时,常利用二项分布的正态近似.1.小样本时的二项分布概率计算当时,或的检验值由精确计算尺度二项分布的卷积获得.在比较配对资料试验前后有否变化,或增加或减小的假设检验时,如果我们定义试验后比试验前增加为正号,反之为负号,那么对于原假设:试验前后无变
4、化来说,正号的个数和负号的个数可能性应当相等,即正号出现的概率=0.5,于是与均服从二项分布,对于太大的相应太小的,或者太大的相应太小的,都将拒绝接受原假设;对于原假设:试验后比试验前有增加来说,正号的个数大于负号的个数的可能性应该大,即正号出现的概率,对于太小的相应太大的,将拒绝接受原假设;对于原假设:试验后比试验前减小来说,正号的个数小于等于负号的个数的可能性应该大,即正号出现的概率,对于太大的相应太小的,将拒绝接受原假设。例27。1有一种提高学生某种素质的训练,有人说它是无效的,有人说它是有效的,那么真实情况究竟应该是怎样的呢?随机地选取15名学生作为试验样本,在训练开始前做了一次
5、测验,每个学生的素质按优、良、中、及、差打分,经过三个月训练后,再做一次测试对每个学生打分。数据见表27。1所示。我们将素质提高用正号表示,反之用负号表示,没有变化用0表示。显著性水平取0。1.表27。1 训练前后的素质比较学生编号训练之前训练之后差异符号1中优+2及良+3良中-4差中+5良良06中优+7差及+8良优+9中差-10差中+11中优+12及良+13中及—14中优+15差中+从表27。1中15名学生训练前后的差异分析可得出:有14名学生有差异,其中=11,=3。1名学生无差异(学生编号为5),应该从分析中去掉,所以=15—1=14.假设检验为:即训练之后学生素质没有提高。即训练
6、之后学生素质有提高.由于试验的结果只有两种可能,正号或负号,对每一个学生试验出现正号的假定概率为=0。5,负号为1—=0。5,这样整个试验的概率是相同的,并且每一个试验是相互独立的。因此在=14次独立的试验中,正号出现的次数服从二项分布,见表27.2所示.表27。2二项分布的概率和累计概率n=14,p=0.5正号出现的次数正号出现的概率累计概率00。00010。000110.00090.000920。00560。006530.02220.028740.06110.089850.12220.212060.18330.395370.20950。604780.18330.788090。1222
7、0.9102100.06110.9713110.02220.9935120。00560.9991130.00090.9999140.00011.0000从表27。2的累计概率列中我们看到,正号出现的次数大于10的概率为1—0.9713=0.0287,或者换一种方法计算为=0。0001+0.0009+0.0056+0。0222=0。0287,二者的微小差异是因为小数点后舍入问题造成的。而试验的结果:正号出现的次数为11,大于10,出现