卡方-拟合优度检验.ppt

卡方-拟合优度检验.ppt

ID:62246649

大小:689.00 KB

页数:62页

时间:2021-04-22

卡方-拟合优度检验.ppt_第1页
卡方-拟合优度检验.ppt_第2页
卡方-拟合优度检验.ppt_第3页
卡方-拟合优度检验.ppt_第4页
卡方-拟合优度检验.ppt_第5页
资源描述:

《卡方-拟合优度检验.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、生物统计学第七章拟合优度检验-2检验拟合优度检验的意义判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验。简单的说:*用于检验总体是否服从某个指定分布。Ⅰ.检测观察数与理论数之间的一致性;Ⅱ.通过检测观察数与理论数之间的一致性来判定事物之间的独立性。§7.1、拟合优度检验的一般原理7.1.1什么是拟合优度检验(P92)一、2统计量的意义为了便于理解,现结合一实例说明2(读作卡方)统计量的意义。根据遗传学理论,动物的性别比例是1:1。统计某一年所产的876只实验动物,有雄性428只,雌性448只。按1:1的性别比例计算,雌雄均应为

2、438只。以Oi表示实际观察次数,Ti表示理论次数,可将上述情况列成下表。7.1.2拟合优度检验的统计量(P92)表动物性别实际观察次数与理论次数性别实际观察次数Oi理论次数TiOi-Ti(Oi-Ti)2/Ti雌428438-100.2283雄448438100.2283合计87687600.4563从上表可以看到,实际观察次数与理论次数存在一定的差异。这个差异是属于抽样误差、还是其性别比例发生了实质性的变化?要回答这个问题:①首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度;②然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。为了度

3、量实际观察次数与理论次数偏离程度:A:最简单的办法是求出实际观察次数与理论次数的差数。如上表:O1-T1=-10,O2-T2=10,由于这两个差数之和为0,显然此方法不可行;B:计算∑(O-T)2,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。但尚有不足。例如某一组实际观察次数为505、理论次数为500,相差5;而另一组实际观察次数为26、理论次数为21,相差亦为5。为了弥补B这一不足,将各差数平方除以相应的理论次数后再相加,并记之为2,即也就是说2是度量实际观察次数与理论次数偏离程度的一个统计量,2越小,表明实际观察次数与理论次数越接近

4、;2=0,表示两者完全吻合;2越大,表示两者相差越大。二、2分布上面引入了统计量2,它近似地服从统计学中一种连续型随机变量的概率分布2分布。下面对统计学中的2分布作一简略介绍。设有一平均数为μ、方差为的正态总体。现从此总体中独立随机抽取n个随机变量:x1、x2、…、xn,并求出其标准正态离差:记这n个相互独立的标准正态离差的平方和为2:它服从自由度为n的2分布,记为~2(n);若用样本平均数代替总体平均数μ,则随机变量服从自由度为n-1的2分布,记为~显然,2≥0,即2的取值范围是[0,+∞;2分布密度曲线是随自由度不同而

5、改变的一组曲线。随自由度的增大,曲线由偏斜渐趋于对称;df≥30时,接近正态分布。下面给出了几个不同自由度的2概率分布密度曲线。的连续性矫正由公式计算的2只是近似地服从连续型随机变量2分布。在对次数资料进行2检验利用连续型随机变量2分布计算概率时,常常偏低,特别是当自由度为1时偏差较大。Yates(1934)提出了一个矫正公式,矫正后的2值记为:=(7-2)当自由度大于1时,原公式的2分布与连续型随机变量2分布相近似,这时,可不作连续性矫正,但要求各组内的理论次数不小于5。若某组的理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论

6、次数大于5为止。统计量:使用条件:各理论值均大于5。若自由度为1,则应作连续性矫正:方法为:把x的值域分为r个不相重合的区间,再计算在指定的分布下,x落入每一区间的概率pi统计样本含量为n的抽样中,观察值落入各区间的次数Oi用统计量进行检验,步骤如下:§7.2、拟合优度检验7.2.1一般程序(P93)*检验步骤如下:(一)提出无效假设与备择假设(二)选择计算公式(三)计算理论次数(四)计算2值(五)查临界2值,作出统计推断说明:(一)H0:实际观察的属性类别分配符合已知属性类别分配的理论或学说;HA:实际观察的属性类别分配不符合已知属性类别分配的理论

7、或学说。(二)选择计算出2还是2c。(三)在无效假设成立的条件下,按已知属性类别分配的理论或学说计算各属性类别的理论次数。(四)计算出2或2c。(五)根据自由度k-1(若属性类别分类数为k,则适合性检验的自由度为k-1)查2值表(附表)所得的临界2值:20.05、20.01,将所计算得的2或2c值与其比较,作出统计推断:若2(或2c)<20.05,P>0.05,表明实际观察次数与理论次数差异不显著,可以认为实际观察的属性类别分配符合已知属性类别分配的理论或学说;若20.05≤2(或2c)<20.01,若2(或2c)≥

8、20.01,下面结合实例说明适合性检验方法。(总体参数已知)【例】在研究牛的毛

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。