欢迎来到天天文库
浏览记录
ID:17927505
大小:263.00 KB
页数:7页
时间:2018-09-10
《检验和方差分析的原理和基本方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、汽车基地http://www.qcbase.com主机厂与供应商的信息、服务、交流中心!《管理统计学》导学资料六——检验和方差分析这一讲的内容包括两个部分开平方检验和方差分析,重点是方差分析,在本章的学习中,同学们要了解方差分析的用途,检验的作用和用途。学会和掌握方差分析表的使用,了解自由度的计算和F检验的作用,记住方差分析表中的五个等式和含义。本章的关键术语:方差分析(AnalysisofVariance,常简称为ANOVA)是用来检验两个以上样本的均值差异的显著程度,由此判断样本究竟是否抽自具有同一均值总体的方法。 SST-总离差方和(SumofS
2、quareinTotal)为各样本观察值与总均值的离差平方和。 SSTR-组间离差方和(SumofSquareTreatment)表示不同的样本组之间,由于因素取不同的水平所产生的离差平方和。 SSE-组内离差方和(SumofSquareError)表示同一样本组内,由于随机因素影响所产生的离差平方和,简称为组内离差平方和。本章学完后,你应当能够:1、掌握用检验来解决独立性检验和拟合性检验的原理和基本方法,能解决最常见的这类检验问题。 2、了解和懂得单因素方差分析的原理和基本方法,能应用计算机解决最常见的方差分析问题。一、检验检验的用途是检验两个变
3、量之间的独立性和检验数据是否服从某个概率分布得拟合检验。我们经常会遇到受两个或两个以上因素(变量)影响的实验或观察数据,并要求判断两个变量之间是否存在相互联系的问题。如果两个变量之间没有联系则称作是独立的,否则就是不独立的。用分布可以检验两个变量之间的独立性问题。此时我们首先将研究对象的观察数据按两个变量分别进行分类。。例如,按行对第一个变量进行分类,按列对第二个变量进行分类。按这种方法把所有的试验观察数据排列成的表称为列联表。独立性检验的程序和前面介绍的参数假设检验一样,首先也要建立假设,然后计算检验统计量的值。这次采用的检验统计这次采用的检验统计量就
4、是,再根据问题规定的显著性水平查分布表,得到当原假设成立时检验统计量允许的最大临界值,与计算所得的值作比较,得出接受或拒绝原假设的结论。具体步骤如下:1.提出假设:两个变量是独立的,即相互之间没有影响,海量管理资料下载,请登录:汽车基地http://www.qcbase.com汽车基地http://www.qcbase.com主机厂与供应商的信息、服务、交流中心!:两个变量是不独立的,即相互之间有影响。检验的结果如果接受原假设就说明不能推翻两个变量是独立的假设;反之,拒绝,接受2将观测数据分类,计算检验统计量:我们要将需要检验的变量分类,只作如下的
5、表格:变量B的分类变量A的类别12…..m行总和1O11O12…..O1mO1.2O21O22…..O2mO2.…..…..…..…..…..kOk1Ok2…..OkmOk.列总和O.1O.2O.mn这里,Oij表示具有第ij属性的观测的数量,i=1,2,..k,j=1,2,…m,Oi.表示第i行的观测书的总值,O.j表示第j列的观测数的总数。注意,这里Oij是实际观测到的数据分类得到的。我们在后面还要计算在原假设成立的是观测的理论数值。这里n是观测的总数。定义=,这里是上边分类得到的实际观测数,是与之相应的位置上的期望值。是根据概率计算的,在原假设下两
6、个变量独立,因而有:如果两事件独立,则它们的联合概率就等于它们分别概率的乘积,即落入第ij格的概率等于落入第i行的概率与落入第j列的概率的乘积。由此可得到当总的观察值的和为n时,与观察值相对应的期望值可按下式计算得到。=()()=利用上面的公式可以计算出相应的个各个位置上的期望值。如果计算所得到的期望值过小,则最后得到的检验统计量就会估计过大,导致原假设被拒绝的概率过高。因此,实际检验中一般要求所有计算得到的期望值都不小于5。如果某些位置上的期望值小于5就可以把相邻的类别合并,使得结果计算得到的期望值都不小于5。3计算检验我们在上边计算的值
7、,就是反映两个变量独立性程度的变量。如果=0,那么这两个变量独立,当不等于0,越大两个变量独立的可能性越小,当达到一定的程度时我们就可以拒绝两个变量独立的假设。为了确定这个临界值,我们就需要使用分布。首先我们需要确定的自由度,由于在计算期望值的时候,每行总数和每列总数的总和是确定的,因此自由度是行数-1和列数-1的乘积。如果第一个分类变量有r类,第二个分类变量有c类,那么自由度就是:海量管理资料下载,请登录:汽车基地http://www.qcbase.com汽车基地http://www.qcbase.com主机厂与供应商的信息、服务、交流中心!,这时,我
8、们查自由度为的分布,和前面一样计算0.95得分位数,就得到显著性水平为5%的临界
此文档下载收益归作者所有