欢迎来到天天文库
浏览记录
ID:5181595
大小:1.43 MB
页数:70页
时间:2017-11-27
《第七章次数资料分析——2检验》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第七章次数资料分析——2检验本章将分别介绍对次数资料、等级资料进行统计分析的方法。下一张主页退出上一张第一节2统计量与2分布一、2统计量的意义为了便于理解,现结合一实例说明2(读作卡方)统计量的意义。根据遗传学理论,动物的性别比例是1:1。统计某羊场一年所产的876只羔羊中,有公羔428只,母羔448只。按1:1的性别比例计算,公、母羔均应为438只。以A表示实际观察次数,T表示理论次数,可将上述情况列成表7-1。下一张主页退出上一张表7-1羔羊性别实际观察次数与理论次数下一张主页退出上一张从表7-1看到,实际观察次数与理论次数存在一定的差异,这里公、母各相差1
2、0只。这个差异是属于抽样误差(把对该羊场一年所生羔羊的性别统计当作是一次抽样调查)、还是羔羊性别比例发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。从表7-1看出:A1-T1=-10,A2-T2=10,由于这两个差数之和为0,显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。为了避免正、负抵消,可将两个差数A1-T1、A2-T2平方后再相加,即计算∑(A-T)2,
3、其值越大,实际观察次数与理论次数相差亦越大,反之则越小。但利用∑(A-T)2表示实际观察次数与理论次数的偏离程度尚有不足。例如某一组实际观察次数为下一张主页退出上一张505、理论次数为500,相差5;而另一组实际观察次数为26、理论次数为21,相差亦为5。显然这两组实际观察次数与理论次数的偏离程度是不同的。因为前者是相对于理论次数500相差5,后者是相对于理论次数21相差5。为了弥补这一不足,可先将各差数平方除以相应的理论次数后再相加,并记之为2,即下一张主页退出上一张(7-1)也就是说2是度量实际观察次数与理论次数偏离程度的一个统计量,2越小,表明实际观察次数与理
4、论次数越接近;2=0,表示两者完全吻合;2越大,表示两者相差越大。对于表7-1的资料,可计算得表明实际观察次数与理论次数是比较接近的。下一张主页退出上一张二、2分布上面在属于离散型随机变量的次数资料的基础上引入了统计量2,它近似地服从统计学中一种连续型随机变量的概率分布2分布。下面对统计学中的2分布作一简略介绍。设有一平均数为μ、方差为的正态总体。现从此总体中独立随机抽取n个随机变量:x1、x2、…、xn,并求出其标准正态离差:,,…,下一张主页退出上一张记这n个相互独立的标准正态离差的平方和为2:(7-2)它服从自由度为n的2分布,记为~2(n);
5、下一张主页退出上一张若用样本平均数代替总体平均数μ,则随机变量(7-3)服从自由度为n-1的2分布,记为~下一张主页退出上一张显然,2≥0,即2的取值范围是[0,+∞;2分布密度曲线是随自由度不同而改变的一组曲线。随自由度的增大,曲线由偏斜渐趋于对称;df≥30时,接近平均数为的正态分布。图7-1给出了几个不同自由度的2概率分布密度曲线。下一张主页退出上一张三、的连续性矫正由(7-1)式计算的2只是近似地服从连续型随机变量2分布。在对次数资料进行2检验利用连续型随机变量2分布计算概率时,常常偏低,特别是当自由度为1时偏差较大。Yates(1934)提出
6、了一个矫正公式,矫正后的2值记为:=(7-4)下一张主页退出上一张当自由度大于1时,(7-1)式的2分布与连续型随机变量2分布相近似,这时,可不作连续性矫正,但要求各组内的理论次数不小于5。若某组的理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大于5为止。下一张主页退出上一张第二节适合性检验一、适合性检验的意义判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验称为适合性检验。下一张主页退出上一张在适合性检验中,无效假设为H0:实际观察的属性类别分配符合已知属性类别分配的理论或学说;备择假设为HA:实际观察的属性类别分配不符合已知属
7、性类别分配的理论或学说。并在无效假设成立的条件下,按已知属性类别分配的理论或学说计算各属性类别的理论次数。因所计算得的各个属性类别理论次数的总和应等于各个属性类别实际观察次数的总和,即独立的理论次数的个数等于属性类别分下一张主页退出上一张类数减1。也就是说,适合性检验的自由度等于属性类别分类数减1。若属性类别分类数为k,则适合性检验的自由度为k-1。然后根据(7-1)或(7-4)式计算出2或2c。将所计算得的2或2c值与根据自由度k-1查2值表(附表8)所得的临界2值:20.05、20.01比较:下一张主页退出
此文档下载收益归作者所有