资源描述:
《第3章 Visual FoxPro基础(1)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、前面已经研究了假设检验的基本思想,并讨论了当总体分布已知时,关于其中未知参数的假设检验问题.然而可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设.例如,从1500年到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这432年间共爆发了299次战争,具体数据如下:战争次数X0123422314248154发生X次战争的年数Poisson分布?对总体分布进行检验的问题称为分布的拟合检验.第四节分布拟合检验K.皮尔逊χ2检验法是在总体X的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法.基本思想:H0:总体X的分布函数为
2、F(x)然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设.这种检验通常称作拟合优度检验,它是一种非参数检验.基本原理和步骤如下:一、χ2拟合优度检验提出原假设:3.根据所假设的理论分布,可以算出总体X的值落入每个Ai的概率pi,于是npi就是落入Ai的样本值的理论频数.将总体X的取值范围分成k个互不重迭的小区间(或小组),记作A1,A2,…,Ak.2.把落入第i个小区间Ai的样本值的个数记作ni,称为实测频数.所有实测频数之和n1+n2+…+nk等于样本容量n.它标志着经验分布与理论分布之间的差异的大小.4.皮尔逊引进如下统计量表示经验分布与理论分布之间的差异:在理论
3、分布已知的条件下,npi是常量实测频数理论频数其分布是什么?H0:P(Ai)=pi,i=1,2,….k.Pearson证明了如下若原假设中的理论分布F(x)已经完全给定,那么当n充分大时,统计量注:若在H0下分布类型已知,但其参数未知,这时需要先用最大似然估计法估计参数,然后作检验.Fisher证明了如下若原假设中的理论分布F(x)中有r个未知参数需用相应的最大似然估计来代替,那么当n充分大时,统计量定理1:定理2:如果根据所给的样本值x1,x2,..,xn算得统计量χ2的实测值落入拒绝域,则拒绝原假设;否则就认为差异不显著而接受原假设.分别得拒绝域:(不需估计参数)(估计r个参数)查χ2分布
4、表可得临界值χ21-α,使得根据以上定理,对给定的显著性水平α,注:皮尔逊定理是在n无限增大时推导出来的,因而使用时要注意n要足够大以及npi不太小这两个条件.根据计算实践,要求n不小于50以及npi不小于5.否则应适当合并相邻区间,使npi满足此要求.例1.掷一颗骰子60次,结果如下:试在α=0.05水平下检验其是否均匀?(P367)点数123456合计次数78121191360解:这是一个分布的拟合优度检验,记出现点数i的概率为pi,提出假设:检验的拒绝域为:现在α=0.05,k=6,查表得由样本,得检验统计量的值:未落入拒绝域,即认为是均匀的。例2.试检验每年爆发战争次数分布是否服从泊松
5、分布.解:这是一个分布的拟合优度检验,提出假设:H0:X~P(λ)按参数为0.69的泊松分布,计算事件X=i的概率pi,将有关计算结果列表如下:pi的估计是i=0,1,2,3,4由观察值,得参数λ的最大似然估计为战争次数X实测频数ni02230.5016216.70.18311420.346149.50.3762480.119451.60.2513150.027511.861.863440.004742.05合计2992.67313.91注:将n<5的组予以合并,即将发生3次及以上次数的组归并为一组.≥3因H0所假设的理论分布中有一个未知参数,即r=1,又k=4,故自由度为4-1-1=2.又α
6、=0.05,查χ2分布表得:未落入拒绝域,例3.某建筑单位宣称其麾下的建筑工地每天发生的事故不超过0.6起.现记录了该建筑单位工地200天的安全生产情况,数据如下,试在α=0.05水平下检验其宣称是否成立?(P352)一天发生的事故数012345≥6合计天数10259308010200分析:先检验每天发生的事故数服从泊松分布,这是关于总体分布的拟合优度检验,再进行关于总体均值的大样本检验.检验的拒绝域为:由样本,得检验统计量的值:故认为每年发生战争次数X服从泊松分布.事故次数X实测频数ni01020.477195.420.45371590.353170.611.90902300.130626.
7、130.5732380.03226.440.172400.00601.20510.00090.18≥600.00010.02合计20012003.108按α=0.05,自由度为4-1-1=2查χ2分布表得按参数为0.74的泊松分布,计算事件X=i的概率pi,将有关计算结果列表如下:pi的估计是i=0,1,2,3,4,5,6由观察值,得参数λ的最大似然估计为7.84由样本得:=3.108<5.991