检验和方差分析的原理和基本方法

检验和方差分析的原理和基本方法

ID:17927505

大小:263.00 KB

页数:7页

时间:2018-09-10

检验和方差分析的原理和基本方法_第1页
检验和方差分析的原理和基本方法_第2页
检验和方差分析的原理和基本方法_第3页
检验和方差分析的原理和基本方法_第4页
检验和方差分析的原理和基本方法_第5页
资源描述:

《检验和方差分析的原理和基本方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、汽车基地http://www.qcbase.com主机厂与供应商的信息、服务、交流中心!《管理统计学》导学资料六——检验和方差分析这一讲的内容包括两个部分开平方检验和方差分析,重点是方差分析,在本章的学习中,同学们要了解方差分析的用途,检验的作用和用途。学会和掌握方差分析表的使用,了解自由度的计算和F检验的作用,记住方差分析表中的五个等式和含义。本章的关键术语:方差分析(AnalysisofVariance,常简称为ANOVA)是用来检验两个以上样本的均值差异的显著程度,由此判断样本究竟是否抽自具有同一均值总体的方法。  SST-总离差方和(SumofS

2、quareinTotal)为各样本观察值与总均值的离差平方和。  SSTR-组间离差方和(SumofSquareTreatment)表示不同的样本组之间,由于因素取不同的水平所产生的离差平方和。  SSE-组内离差方和(SumofSquareError)表示同一样本组内,由于随机因素影响所产生的离差平方和,简称为组内离差平方和。本章学完后,你应当能够:1、掌握用检验来解决独立性检验和拟合性检验的原理和基本方法,能解决最常见的这类检验问题。  2、了解和懂得单因素方差分析的原理和基本方法,能应用计算机解决最常见的方差分析问题。一、检验检验的用途是检验两个变

3、量之间的独立性和检验数据是否服从某个概率分布得拟合检验。我们经常会遇到受两个或两个以上因素(变量)影响的实验或观察数据,并要求判断两个变量之间是否存在相互联系的问题。如果两个变量之间没有联系则称作是独立的,否则就是不独立的。用分布可以检验两个变量之间的独立性问题。此时我们首先将研究对象的观察数据按两个变量分别进行分类。。例如,按行对第一个变量进行分类,按列对第二个变量进行分类。按这种方法把所有的试验观察数据排列成的表称为列联表。独立性检验的程序和前面介绍的参数假设检验一样,首先也要建立假设,然后计算检验统计量的值。这次采用的检验统计这次采用的检验统计量就

4、是,再根据问题规定的显著性水平查分布表,得到当原假设成立时检验统计量允许的最大临界值,与计算所得的值作比较,得出接受或拒绝原假设的结论。具体步骤如下:1.提出假设:两个变量是独立的,即相互之间没有影响,海量管理资料下载,请登录:汽车基地http://www.qcbase.com汽车基地http://www.qcbase.com主机厂与供应商的信息、服务、交流中心!:两个变量是不独立的,即相互之间有影响。检验的结果如果接受原假设就说明不能推翻两个变量是独立的假设;反之,拒绝,接受2将观测数据分类,计算检验统计量:我们要将需要检验的变量分类,只作如下的

5、表格:变量B的分类变量A的类别12…..m行总和1O11O12…..O1mO1.2O21O22…..O2mO2.…..…..…..…..…..kOk1Ok2…..OkmOk.列总和O.1O.2O.mn这里,Oij表示具有第ij属性的观测的数量,i=1,2,..k,j=1,2,…m,Oi.表示第i行的观测书的总值,O.j表示第j列的观测数的总数。注意,这里Oij是实际观测到的数据分类得到的。我们在后面还要计算在原假设成立的是观测的理论数值。这里n是观测的总数。定义=,这里是上边分类得到的实际观测数,是与之相应的位置上的期望值。是根据概率计算的,在原假设下两

6、个变量独立,因而有:如果两事件独立,则它们的联合概率就等于它们分别概率的乘积,即落入第ij格的概率等于落入第i行的概率与落入第j列的概率的乘积。由此可得到当总的观察值的和为n时,与观察值相对应的期望值可按下式计算得到。=()()=利用上面的公式可以计算出相应的个各个位置上的期望值。如果计算所得到的期望值过小,则最后得到的检验统计量就会估计过大,导致原假设被拒绝的概率过高。因此,实际检验中一般要求所有计算得到的期望值都不小于5。如果某些位置上的期望值小于5就可以把相邻的类别合并,使得结果计算得到的期望值都不小于5。3计算检验我们在上边计算的值

7、,就是反映两个变量独立性程度的变量。如果=0,那么这两个变量独立,当不等于0,越大两个变量独立的可能性越小,当达到一定的程度时我们就可以拒绝两个变量独立的假设。为了确定这个临界值,我们就需要使用分布。首先我们需要确定的自由度,由于在计算期望值的时候,每行总数和每列总数的总和是确定的,因此自由度是行数-1和列数-1的乘积。如果第一个分类变量有r类,第二个分类变量有c类,那么自由度就是:海量管理资料下载,请登录:汽车基地http://www.qcbase.com汽车基地http://www.qcbase.com主机厂与供应商的信息、服务、交流中心!,这时,我

8、们查自由度为的分布,和前面一样计算0.95得分位数,就得到显著性水平为5%的临界

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。