欢迎来到天天文库
浏览记录
ID:20903778
大小:914.50 KB
页数:27页
时间:2018-10-17
《拟合优度的卡方检验》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、在前面的课程中,我们已经了解了假设检验的基本思想,并讨论了当总体分布为正态时,关于其中未知参数的假设检验问题.然而可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设.例如,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这432年间共爆发了299次战争,具体数据如下:战争次数X0123422314248154发生X次战争的年数在概率论中,大家对泊松分布产生的一般条件已有所了解,容易想到,每年爆发战争的次数,可以用一个泊松随机变量来近似描述.也就是说,我们可以假设每年爆发战争次数分布X近似泊松
2、分布.上面的数据能否证实X具有泊松分布的假设是正确的?现在的问题是:又如,某钟表厂对生产的钟进行精确性检查,抽取100个钟作试验,拨准后隔24小时以后进行检查,将每个钟的误差(快或慢)按秒记录下来.问该厂生产的钟的误差是否服从正态分布?再如,某工厂制造一批骰子,声称它是均匀的.为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与1/6的差距.也就是说,在投掷中,出现1点,2点,…,6点的概率都应是1/6.得到的数据能否说明“骰子均匀”的假设是可信的?问题是:K.皮尔逊这是一项很重要的工作,不少人把它视为近代统计学的开端.解决这类问题的工具是英国统计
3、学家K.皮尔逊在1900年发表的一篇文章中引进的所谓检验法.检验法是在总体X的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法.H0:总体X的分布函数为F(x)然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设.使用对总体分布进行检验时,我们先提出原假设:检验法这种检验通常称作拟合优度检验,它是一种非参数检验.在用检验假设H0时,若在H0下分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验.检验法分布拟合的的基本原理和步骤如下:检验法3.根据所假设的理论分布,可以算出总体X的值落入每个Ai的概
4、率pi,于是npi就是落入Ai的样本值的理论频数.1.将总体X的取值范围分成k个互不重迭的小区间,记作A1,A2,…,Ak.2.把落入第i个小区间Ai的样本值的个数记作fi,称为实测频数.所有实测频数之和f1+f2+…+fk等于样本容量n.标志着经验分布与理论分布之间的差异的大小.皮尔逊引进如下统计量表示经验分布与理论分布之间的差异:统计量的分布是什么?在理论分布已知的条件下,npi是常量实测频数理论频数皮尔逊证明了如下定理:若原假设中的理论分布F(x)已经完全给定,那么当时,统计量的分布渐近(k-1)个自由度的分布.如果理论分布F(x)中有r个未知参数需用相
5、应的估计量来代替,那么当时,统计量的分布渐近(k-r-1)个自由度的分布.为了便于理解,我们对定理作一点直观的说明.是k个近似正态的变量的平方和.这些变量之间存在着一个制约关系:故统计量渐近(k-1)个自由度的分布.在理论分布F(x)完全给定的情况下,每个pi都是确定的常数.由棣莫佛-拉普拉斯中心极限定理,当n充分大时,实测频数fi渐近正态,因此在F(x)尚未完全给定的情况下,每个未知参数用相应的估计量代替,就相当于增加一个制约条件,因此,自由度也随之减少一个.若有r个未知参数需用相应的估计量来代替,自由度就减少r个.此时统计量渐近(k-r-1)个自由度的分布
6、.如果根据所给的样本值X1,X2,…,Xn算得统计量的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设.得拒绝域:(不需估计参数)(估计r个参数)查分布表可得临界值,使得根据这个定理,对给定的显著性水平,皮尔逊定理是在n无限增大时推导出来的,因而在使用时要注意n要足够大,以及npi不太小这两个条件.根据计算实践,要求n不小于50,以及npi都不小于5.否则应适当合并区间,使npi满足这个要求.让我们回到开始的一个例子,检验每年爆发战争次数分布是否服从泊松分布.提出假设H0:X服从参数为的泊松分布按参数为0.69的泊松分布,计算事件X=i的概率p
7、i,=0.69将有关计算结果列表如下:pi的估计是,i=0,1,2,3,4根据观察结果,得参数的极大似然估计为因H0所假设的理论分布中有一个未知参数,故自由度为4-1-1=2.x01234fi223142481540.580.310.180.010.02n216.7149.551.612.02.160.1830.3760.2511.623战争次数实测频数14.162.43将n<5的组予以合并,即将发生3次及4次战争的组归并为一组.故认为每年发生战争的次数X服从参数为0.69的泊松分布.按=0.05,自由度为4-1-1=2查分布表得=5.991=2.43<5.9
8、91,由于统计量的实测值未落入否定域.
此文档下载收益归作者所有