欢迎来到天天文库
浏览记录
ID:36848159
大小:363.60 KB
页数:21页
时间:2019-05-10
《《单样本非参数检验》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二章单样本非参数检验第一节符号检验第二节中位数的置信区间第三节Wilcoxon符号秩检验第一节符号检验符号检验(SINGTEST)是利用正号和负号的数目对某种假设做出判定的非参数方法。符号检验虽然是最简单的非参数检验,但它体现了非参数统计的一些基本思路.首先看一个例子。平均数mean(包括切尾平均数)中位数median和众数mode都可用来表示数据的中心位置,参数数据分析中总体的中心位置常用均值表示,例如当总体服从正态分布时,使用检验方法检验均值。而非参数数据分析方法中,总体的中心位置常用总体的中位数表示,故关于中心位置的检验问题就是关于中位数的检验问题。例1联合国人员在世界上66个大城
2、市的生活花费指数(以纽约市1996年12月为100)按自小至大的次序排列如下(这里北京的指数为99):66757880818182838383838485858686868687878888888888898989899090919191919293939696969799100101102103103104104104105106109109110110110111113115116117118155192这个总体的中间水平是多少?北京市在该水平之上还是之下?(北京为99)这个例子经过简单计算,得到样本均值为96.45,而样本中位数为91;它们都可作为总体的中心的估计,除此之外,众数(频率最
3、大的点,本例是88)可作为中间位置.在本例中,总体分布是未知的,为此从看该数据的直方图中很难说这是什么分布。假定用总体中位数M来表示中间位置,就意味着样本点取大于M的概率应该与取小于M的概率相等。所研究的问题可以看作是只有两种可能“成功”或“失败”。成功为“+”,即大于中位数M;失败为“-”,即小于中位数M。令S+=得正符号的数目S—=得负符号得数目可以知道S+或S—均服从二项分布B(66,0.5)。则S+和S—可以用来作检验的统计量.左侧检验,当零假设为真的时,S+应该不大不小。当S+过小,即只有少数的观测值大于99,则认定中位数99可能太大,实际总体的中位数可能要小一些。对于右侧检验,当零
4、假设为真的时,S+应该不大不小。当S+过大,即有多数的观测值大于99,则认定中位数99可能太小,目前实际总体的中位数可能要大一些。双侧检验对备择假设H1来说关心的是等于正的次数是否与等于负的次数有差异。一般情况,备择假设采用我们觉得有道理的方向。上面的例题采用左侧检验,备择检验:M<99。因为只有一点为99,舍去这一点,于是从66减少到65。而s+=23在零假设下(下面概率p=0.5),二项分布的概率就是该检验的p值。P(S+<23)=0.0124。也就是说,在零假设下,目前由该样本所代表的事件的发生的概率仅为0.0124,所以不大可能。也就是说,北京的生活指数(99)不可能小于世界大城市的中
5、间水准.对于双边假设检验,为计算方便,一般取S+和S—中较小的一个做检验统计量;如用K表示,则K=min(S+,S—)。在本例子中,若是双边检验,P值应该二倍于单侧检验的。检验统计量(s+=23)S+(s+=23)P-值P(S+<23)=0.01242P(S+<23)=0.0248检验的结果拒绝零假设拒绝零假设结论中位数小于99中位数不等于99[例]生产过程是否需要调整。某企业生产一种钢管,规定长度的中位数是l0米。现随机地:从正在生产的生产线上选取10根进行测量,结果:9.810.19.79.99.810.09.710.09.99.8分析:中位数是这个问题中所关心的一个位置参数。若产品长度真
6、正的中位数大于或小于10米,则生产过程需要调整。故做双侧检验,建立假设为了对假设作出判定,先要得到检验统计量S+或S—。将调查得到数据分别与10比较,算出各个符号的数目:s+=1,s—=7,n=8。p大于显著性水平0.05。表明调查数据支持原假设。即生产过程不需要调整。第二节基于符号检验的中位数置信区间例我国国有经济15个行业的1996年职工平均工资按从小到大的次序为(单位:元)403849405798616163446610669567096967699278977987854686798701求中位数的置信区间。定义2.1把n个样本点按从小达到的顺序排列,得假设顺序统计量,由构成区间作为中
7、位数的置信区间。由于大于和小于中位数M的样本点数服从B(N,0.5)由于得到的区域是以中位数位对称的,故kP(K
此文档下载收益归作者所有