非参数统计学讲义(第二章)讲稿

非参数统计学讲义(第二章)讲稿

ID:15845251

大小:903.00 KB

页数:22页

时间:2018-08-06

非参数统计学讲义(第二章)讲稿_第1页
非参数统计学讲义(第二章)讲稿_第2页
非参数统计学讲义(第二章)讲稿_第3页
非参数统计学讲义(第二章)讲稿_第4页
非参数统计学讲义(第二章)讲稿_第5页
资源描述:

《非参数统计学讲义(第二章)讲稿》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第二章单样本模型§1符号检验和有关的置信区间在有了一个样本之后,很自然地想要知道它所代表的总体的“中心”在哪里.例如,在对人们的收入进行了抽样之后,就自然要涉及“人均收入”和“中间收入”等概念.这就与统计中的对总体的均值(mean),中位数(median)和众数(mode)等位置参数的推断有关。例如,在知道总体是正态分布时,要检验其均值是否为;一个传统的基于正态理论的典型方法是t检验.它的检验统计量定义为这里为样本均值,而为样本标准差。t—检验的统计量在零假设下有n—1个自由度的t—分布。检验统计量是用样本标准差

2、s代替了有标准正态分布的检验统计量的总体标准差后而产生的在大样本时,二者几乎相等。t—检验也许是世界上用得最广泛的检验之一。但是,t—检验并不稳健,在不知总体分布时,特别是小样本时,应用t—检验就可能有风险。这时就要考虑使用非参数方法。对于本章所要介绍的数据趋势或随机性检验,就不存在简单的参数方法.非参数方法总是简单实用的。本章所介绍的一些检验有代表性,因此这里的讨论将比其它章节更为仔细.一旦熟悉了非参数方法的一些基本思路,后面的内容就很容易理解了.一、问题的提出【例2-1】联合国人员在世界上66个大城市生活花费

3、指数(以纽约市1962年12为100)按自小至大的次序排列如下(这里北京的指数为99):表2-1生活花费指数数据66757880818182838383838485858686868687878888888888898989899090919191919293939696969799100101102103103104104104105106109109110110110111113115116117118155192在例子中,人们可能会问:①总体的平均(或者中间)水平刻划位置参数的量有:①平均值:;②中位数:;

4、③修整均值:,;④众数;⑤中列数:。是多少?②北京是在该水平之上还是之下?21第页可以假定这个样本是从世界许多大城市中随机抽样而得的所有大城市的指数组成总体.可能出现的问题是:这个总体的平均(或者中间)水平是多少?北京是在该水平之上还是之下?这里的平均(或中间)水平是一个位置参数。一般的统计书中的均值就是一个位置参数.中位数是另一个位置参数.它们都是数据总体中心位置的度量和位置参数相对的一个参数为尺度参数;比如在标准统计课本中的描述数据集中和分散程度的方差或标准差.这个例子经过简单计算,得到样本均值为96.45,

5、而样本中位数为91;它们都可作为总体的中心的估计,除此之外,众数(频率最大的点,本例是88)可作为中间位置.通常在正态总体分布的假设下,关于总体均值的假设检验和区间估计是用与t检验有关的方法进行的。然而,在本例中,总体分布是未知的为此首先看该数据的直方图从图中很难说这是什么分布。在右边的两个点分别是东京和香港。由于此时我们不知道总体是否为正态分布(或者数据表明它就不是一个正态分布),所以有关参数统计中的t-统计量就不能用,势必要选择非参数的统计量来解决这样的问题。符号检验(SignTest)是利用正、负号的数目对

6、某种假设作出判定的非参数统计方法。一、普通的符号检验1.基本方法如果所研究的问题,可以看作是只有两种可能:“成功”或“失败”,并且成功或失败的出现被假定遵从二项式分布,以“+”表示成功,以“-”表示失败,那么随机抽取的样本就有两个参数:成功的概率P+和失败的概率P—。这样就可以构造一个假设:这是双侧检验,对备择假设H1来说,不要求P+是否大于P—。如果所研究的问题,要求考虑是P+比较大还是P—比较大,则需用单侧备择假设,即这里表示P+是比较大的,被用来说明P—是比较大的。为了检验上面的假设,普通的符号检验所定义的

7、检验统计量为和。表示为正符号的数目,表示为负符号的数目,是符号的总数目。要对假设作出判定,需要找到一个P值。因为对于和来说,抽样分布是一个带有(表示成功的概率)的二项式分布,所以如果H0为真,从二项分布表中能够根据n、和21第页查到P值。若P值很小,表明H0为真的可能性很小,数据不支持H0,而支持H1。注:①双边假设检验中的尾概率P-值应是单边假设检验中的P-值的2倍;②在n()较小时,可以利用二项分布表查表,计算出精确的P-值;在n(n>20)较大时,则要用正态分布来近似,因为,所以,并且要作连续性修正。(0.

8、1)③普通的符号检验其判定可以归纳如表2—2所示。注释:表2-2生活花费指数数据注意与教材中取最小二者之间最小值的等价性。备择假设P值(二项分布表)的右尾概率的左尾概率的右尾概率的左尾概率和中大者右尾概率的2倍和中小者左尾概率的2倍备择假设P值(正态分布表)的右尾概率的右尾概率和中大者右尾概率的2倍2.应用在实际问题的研究中,常常会遇到难以用数值确切表达的问题,而采用符号

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。