欢迎来到天天文库
浏览记录
ID:51313890
大小:1.25 MB
页数:96页
时间:2020-03-22
《经典非参数假设检验方法全.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、非参数假设检验在前面的课程中,我们已经了解了假设检验的基本思想,并讨论了当总体分布为正态时,关于其中未知参数的假设检验问题.然而可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布形式提出种种假设,然后利用样本信息对假设进行检验。在统计学中把不依赖于分布形式的统计方法称为非参数统计。对总体的分布形式的检验就是非参数检验。例如,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这432年间共爆发了299次战争,具体数据如下:战争次数X0123422314248154发生X次战争的年数在概率论中,大家对泊松分布产生的一般条件已有所了解,
2、容易想到,每年爆发战争的次数,可以用一个泊松随机变量来近似描述.也就是说,我们可以假设每年爆发战争次数分布X近似泊松分布.现在的问题是:上面的数据能否证实X具有泊松分布的假设是正确的?又如,某钟表厂对生产的钟进行精确性检查,抽取100个钟作试验,拨准后隔24小时以后进行检查,将每个钟的误差(快或慢)按秒记录下来.问该厂生产的钟的误差是否服从正态分布?再如,某工厂制造一批骰子,声称它是均匀的.为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与1/6的差距.也就是说,在投掷中,出现1点,2点,…,6点的概率都应是1/6.问题是:得到的数据能否说明“骰子均匀”的假设是可信的?本
3、章只介绍2拟合优度检验、柯尔莫哥洛夫以及斯米尔诺夫检验、独立性检验方法。除此还有:符号检验、游程检验、秩和检验等等。K.皮尔逊这是一项很重要的工作,不少人把它视为近代统计学的开端.解决这类问题的工具是英国统计学家K.皮尔逊在1900年发表的一篇文章中引进的所谓2检验法.2检验法是在总体X的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法经典统计的多数检验都假定了总体的背景分布。在那里,总体的分布形式或分布族往往是给定的或者是假定了的。所不知道的仅仅是一些参数得知或它们的范围。于是,人们的主要任务就是对一些参数,比如均值和方差(或标准差)进行估计或检验。如检验正
4、态分布的均值是否相等或等于零等等。最常见的检验是和正态总体有关的t-检验、F-检验、X2检验和最大似然比检验等。为什么用非参数方法?为什么用非参数方法?非参数检验是针对参数检验而言的。从检验步骤上讲,二者是一致的:它们都是对总体的某种数量特征建立相应的原假设和备择假设,都是在给定的显著性水平下,根据实际统计量来判断对原假设的取舍。二者的不同之处在于:参数检验需要对总体分布作限制性的假定。这种假定实际就是要求总体的分布类型已知,所不知道的只是其中的某个参数,如均值或方差。而非参数检验并不要求已知总体的分布信息,而是根据数据本身来推断总体参数。为什么用非参数方法?在实际生活中,总体的分布信
5、息并不是容易得到的。有时,数据并不是来自所假定的总体;或者,数据根本不是来自同一个总体;还有可能,数据因为种种原因被严重“污染”。这样,在假定总体分布的情况下进行推断的做法就可能产生错误的或者甚至灾难性的结论。于是,人们希望在不假定总体分布的情况下,尽量从数据本身来获得所需要的信息,这就是非参数统计的宗旨。为什么用非参数方法?正是由于非参数检验要求的信息少,检验条件比较宽松,因此它具有很强的适应性,应用的范围比起参数检验更宽广。非参数检验不仅可以应用于定距、定比数据的检验而且也适用于定类、定序数据的假设检验。对于那些不能直接进行加减乘除四则运算的数据,运用符号检验、秩和检验都能起到比较
6、好的效果。为什么用非参数方法?非参数检验同样也有其缺点。由于它对总体的分布没有严格的要求,因此在检验过程中会失去许多有用的信息,在方法上就缺乏针对性。而且非参数检验是通过处理样本数据的秩或等级来检验假设的,而不是利用原始数据,这又会失去一些信息,因而检验的有效性有时会比较差。当然,如果我们事先对总体的分布信息一无所知或难下定论,那么建立在数据本身基础上的非参数检验结果要比建立在一个可疑的总体分布基础上得到的参数检验结果要可靠的多。为什么用非参数方法?但是在总体分布形式已知时,非参数检验就不如传统方法效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检
7、验无法拒绝。但非参数统计在总体未知时效率要比传统方法要高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定。为什么用非参数方法?那么,如何在不知道总体分布的情况下利用数据本身的信息来进行假设检验呢?我们知道,一组数据最基本的信息就是次序。我们把样本中各个数据按从小到大的顺序排列起来,则每个数据都会在这个顺序数列中有它的位置或次序,这个位置或次序就叫做秩。数据有多少个观察值,就有多少个秩。在一定的假设下,这些秩和它们的统计量的
此文档下载收益归作者所有