资源描述:
《拟合优度检验.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、在前面的讨论中,我们总假定总体的分布形式是已知的。例如,假设总体分布为正态分布N(,2),总体分布为区间(a,b)上的均匀分布,等等。然而,在实际问题中,我们所遇到的总体服从何种分布往往并不知道。需要我们先对总体的分布形式提出假设,如:总体分布是正态分布N(,2),总体分布是区间(a,b)上均匀分布等,然后利用数据(样本)对这一假设进行检验,看能否获得通过。§8.4拟合优度检验这是一项非常重要的工作,许多学者视它为近代统计学的开端。解决这类问题的方法最早由英国统计学家K.Pearson(皮尔逊)于1900年在他发表的一篇文章中给出,该方法后被称为Pea
2、rsonχ2检验法,简称χ2检验。设F(x)为一已知的分布函数,现有样本X1,X2,…,Xn,但我们并不知道样本的总体分布是什么。现在试图检验H0:总体X的分布函数为F(x);(1)对立假设为H1:总体X的分布函数非F(x)。如果F(x)形式已知,但含有未知参数θ或参数向量θ=(θ1,θ2,…,θr),则记其为F(x,θ)。这种检验通常称为拟合优度检验。不妨设总体X是连续型分布。检验思想与步骤如下:(1).将总体X的取值范围分成k个互不重叠的小区间I1,I2,…,Ik,(2).计算各子区间Ii上的理论频数。如果总体的分布函数为F(x,θ),那么每个点落在区间I
3、i上的概率均为n个点中,理论上有npi(θ)个点落在Ii上,(称为理论频数)。当分布函数中含有未知参数θ时,理论频数也未知,要用来估计npi(θ),其中为θ的极大似然估。(3).计算各子区间Ii上的实际频数fi。fi=﹟{X1,X2,…,Xn∈Ii},i=1,2,…,k.计数符号,取集合中元素的个数(4).计算理论频数与实际频数的偏差平方和。可以证明:在H0成立,且n→∞时,(5).H0的显著性水平为α的检验的拒绝域为注意:该检验方法是在n充分大时使用的,因而,使用时要注意n必须足够地大,以及npi不能太小这两个条件。在实用上,一般要求n≥50,以及所有npi
4、≥5。如果初始子区间划分不满足后一个条件,则适当地将某些子区间合并,可使npi满足上述要求。例1:为检验棉纱的拉力强度X(单位:千克)服从正态分布,从一批棉纱中随机抽取300条进行拉力试验,结果列在表8.2中。给定α=0.01,检验假设H0:拉力强度X~N(μ,σ2).解:本例中,并未给出各观测值Xi的具体值,只给出了各观测值的取值范围,这样的数据称为区间数据。样本均值与样本方差可通过下列式计算:(1).先将数据Xi分成13组,每组落入一个区间,区间的端点为:(2).计算数据落入各子区间的理论频数。因分布中含有两个未知参数,所以,理论频数只能近似地估计。落入第
5、i个子区间Ii的理论频数的估计为,其中(3).计算数据落入各子区间上的实际频数fi。fi=﹟{X1,X2,…,Xn∈Ii},i=1,2,…,10.(4).计算检验统计量的值因为k=10,r=2,所以上述χ2分布的自由度为k-r-1=7。由(5).H0的显著性水平为α的检验于是,拒绝原假设,即认为棉纱拉力强度不服从正态分布。孟德尔在关于遗传问题的研究中,用豌豆做实验。豌豆有黄和绿两种颜色,在对它们进行两代杂交之后,发现一部分杂交豌豆呈黄色,另一部分呈绿色。其数目的比例大致是3:1。χ2检验的一个著名应用例子是孟德尔豌豆实验。奥地利生物学家孟德尔在1865年发表的
6、论文,事实上提出了基因学说,奠定了现代遗传学的基础。他的这项伟大发现的过程有力地证明了统计方法在科学研究中的作用。因此,我们有必要在这里将这一情况介绍给大家。这只是一个表面上的统计规律。但它启发孟德尔去发展一种理论,以解释这种现象。他大胆地假定存在一种实体,即现在我们称为“基因”的东西,决定了豌豆的颜色。这基因有黄绿两个状态,一共有四种组合:孟德尔把他的实验重复了多次,每次都得到类似结果。(黄,黄),(黄,绿),(绿,黄),(绿,绿).(黄,黄),(黄,绿),(绿,黄),(绿,绿).孟德尔认为,前三种配合使豆子呈黄色,而第四种配合使豆子呈绿色。从古典概率的观点
7、看,黄色豆子出现的概率为3/4,绿色豆子出现的概率为1/4。这就解释了黄绿颜色豆子之比为什么总是接近3:1这个观察结果。孟德尔这个发现的深远意义是他开辟了遗传学研究的新纪元。下面的例子就是用χ2检验来检验孟德尔提出黄绿颜色豌豆数目之比为3:1的论断。例2:孟德尔豌豆试验中,发现黄色豌豆为25粒,绿色豌豆11粒,试在α=0.05下,检验豌豆黄绿之比为3:1。解:定义随机变量X(1).将(-∞,∞)分成两个区间(2).计算每个区间上的理论频数,这里n=25+11=36,不存在要估计的未知参数,故(3).实际频数为,f1=25,f2=11.(4).计算统计量的值(5
8、).H0的显著性水平为α的检验所以,接