非参数统计学讲义(第六章)讲稿2

非参数统计学讲义(第六章)讲稿2

ID:25896567

大小:415.53 KB

页数:8页

时间:2018-11-23

非参数统计学讲义(第六章)讲稿2_第1页
非参数统计学讲义(第六章)讲稿2_第2页
非参数统计学讲义(第六章)讲稿2_第3页
非参数统计学讲义(第六章)讲稿2_第4页
非参数统计学讲义(第六章)讲稿2_第5页
资源描述:

《非参数统计学讲义(第六章)讲稿2》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、非参数统计学讲义第六章分布检验和某些卡方检验§1引言本章属于拟合优度检验问题,即模型检验或分布的检验,属于非参数检验的范畴。在初等统计中,人们要想知道数据是否服从某一特定分布,可以通过直方图,或P-P图,Q-Q图来直接判断,但这种直观的方式很不精确。本章将介绍几种分布的检验:K-S检验,Lilliefors检验和检验。实际上,K-S检验是在针对检验的缺点检验与K-S检验均属拟合优度检验,但检验常用于定类尺度测量数据,K-S检验还用于定序尺度测量数据;当预期频数较小时,检验常需要合并邻近的类别才能计算,K-S检验则不需要,因此它能比检验保留更多

2、的信息;对于特别小的样本数目,检验不能应用,而K-S检验则不受限制。上提出的。它们是建立在经验分布函数基础上的检验结果。§2Kolmogorov检验一、基本假设一般地要检验手中的样本是否来自某个已知,假定其真实分布为,对应的检验类型有对至少有一个x对至少有一个x对至少有一个x设为该组数据的经验分布函数,则二、基本方法Kolmogorov于三十年代提出了一种基于经验分布的检验方法,基本思想是:由格里文科定理,当时,样本经验分布以概率1一致收敛到总体分布F,为此可以定义到的距离为当H0成立时,由格氏定理,D以概率1收敛到0,因此D的大小可以度量对

3、总体分布拟合的好坏。可供选择的检验统计量分别为;类型A类型B类型C在实际操作时,如果有n个观察值,用下面的统计量代替上面的DNOTE:①由的取值是离散的,考虑到跳跃性,该能够保证S与F0之间取得最大距离;②在H0下的分布有表可查,P201③在大样本时,有近似分布,这里的分布函数有表达式,P122,该分布有表可查P203:三、应用举例【例6-1】轴承的内径检验检验某车间生产的20个轴承外座圈的内径,测得数据如下(单位:mm)表6-1轴承内径数据15.0415.3614.5714.5315.5714.6915.3714.6614.5215.411

4、5.3414.2815.0114.7614.3815.8713.6614.9715.2914.95按照设计要求,这个内径应在15±0.2mm,检验是否符合标准,即检验该数据是否来自均值,方差8第页的正态分布。分析:方法一,可以利用直方图、Q-Q图、P-P图进行直观判断;方法二,利用Kolmogorov检验由P122表中数据得:,拒绝H0,认为不满足要求。近似,P-值=0.979>0.05,接受H0。【例6-2】《数理统计与管理》论文作者服从洛特卡分布洛特卡定律是1926年6月19日洛特卡(Vlachy)在美国颇有影响的学术刊物《华盛顿科学院杂

5、志》上首先提出,它第一次提示了作者与文献量的统计规律性。在这之后,洛特卡进一步发展了洛特卡定律,得出这样的一个关系:若以x表示每一作者所著的论文数,与其相应的写x篇论文的作者数为y,则y与x成反比关系。将46期的《数理统计与管理》的文章按第一作者统计,得到表7-2的结果。论文作者数是否服从洛特卡分布。表6-2论文数目与作者数的统计表论文数(x)1234567作者(y)3432791112分析:洛特卡得出这样的一个关系:若以x表示每一作者所著的论文数,与其相应的写x篇论文的作者数为y,则y与x成反比关系。即有(0.1)式中,N为论文总数,m、C

6、为两个特定的常数,在不同的学科领域数值不同。假定根据表6—2提供的数据,认为论文作者服从洛特卡分布,并对其真实性进行检验,首先必须确定它的理论分布,即计算出m、C的值。估计m的值,通常采用最小二乘法。将(6.1)式进行对数变换,使其线性化,得到:(0.2)m相当于一元线性回归方程中的回归系数b,根据表中的数据运用最小二乘法,得到m=3.0550。关于C值,可以用这样一个公式进行近似计算。这是1985年美国情报学家M.L.Pao教授在数学家的协助之下提出的。计算式为:经计算,。因此46期《数理统计与管理》的论文与作者数的理论洛特卡分布为(0.3

7、)为了判定《数理统计与管理》论文作者的实际分布是否与理论分布一致,可以采用Kolmogorov检验。建立的假设组为对至少有一个x理论累积频率的各个值,可以将x分别代入(6.3)式计算得到,实际累积频率是将累计的作者数分别除以作者总人数得到。计算结果,作者实际累积频率及理论累积频率及各个差值如表6-3。8第页表6-3作者实际累积频率与理论累积频率表12345670.83890.93980.96900.98110.98720.99070.99290.89320.96350.98700.98960.99220.99481.00000.05430.0

8、2370.01800.00850.00500.00410.0071根据显著性水平,作者人数,查表,由于,得临界值。显然因此数据在1%的显著性水平上不能拒绝H0,若显

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。