欢迎来到天天文库
浏览记录
ID:43222114
大小:588.00 KB
页数:61页
时间:2019-10-04
《统计学-第七章 方差分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第七章方差分析PowerPoint统计学主要内容一、方差分析及其有关术语二、方差分析的基本思想和原理三、单因素方差分析四、双因素方差分析第一节方差分析的一般问题一、什么是方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著的影响。单因素方差分析:只涉及一个分类型自变量对数值型因变量的影响双因素方差分析:涉及两个分类型自变量对数值型因变量的影响不同品牌空调的销售额数据万元品牌观测值品牌A品牌B品牌C品牌D123456平均365340350343323400353.53453303633
2、68340349.2358300323353300326.8288290280270280281.6【例7-1】某市场调查公司为了研究品牌对空调销售额的影响,对四个品牌空调的销售情况进行了调查,结果如下表。试分析品牌对空调的销售额是否有显著影响。要分析品牌对空调的销售额是否有显著差异,可以判断4种品牌销售额的均值是否相等。若它们的均值相等,就意味着不同品牌空调销售额无差异,即“品牌”对“销售额”没有显著影响;若均值不全相等,则意味着“品牌”对“销售额”有显著影响。但是这还不能提供充分的证据,因为平均销售额是根
3、据随机样本的数值计算的,均值的差异可能是由于抽样随机性造成的。因此,需要有更准确的方法来检验这种差异是否是显著,就需要进行方差分析。方差分析的有关术语1.因素或因子所要检验的对象称为因素或因子。上例中,要分析品牌对销售额是否有影响,“品牌”是所要检验的对象——因素或因子。2.水平或处理因素的不同表现称为水平或处理。品牌A、品牌B、品牌C、品牌D是“品牌”这一因素的具体表现,称为水平或处理。本例有四个水平。3.观测值每个水平下的样本数据称为观测值。本例不品牌的销售额就是观测值。4.总体因素的每一个水平可以看做是
4、一个总体。如品牌A、品牌B等。5.样本数据调查得到的数据可以看做从总体中抽取的样本数据。本例各品牌的销售额即为样本数据。二、方差分析的基本思想和原理不同品牌空调的销售额数据万元品牌观测值品牌A品牌B品牌C品牌D123456平均365340350343323400353.5345330363368340349.2358300323353300326.8288290280270280281.6【例7-1】某市场调查公司为了研究品牌对空调销售额的影响,对四个品牌空调的销售情况进行了调查,结果如下表。试分析品牌对空调
5、的销售额是否有显著影响。要分析品牌对空调的销售额是否有显著差异,可以判断4种品牌销售额的均值是否相等。若它们的均值相等,就意味着不同品牌空调销售额无差异,即“品牌”对“销售额”没有显著影响;若均值不全相等,则意味着“品牌”对“销售额”有显著影响。但是这还不能提供充分的证据,因为平均销售额是根据随机样本的数值计算的,均值的差异可能是由于抽样随机性造成的。因此,需要有更准确的方法来检验这种差异是否是显著,就需要进行方差分析。从上表中可以看出,各品牌的平均销售额不同,但这还不能提供充分的证据证明品牌对销售额有显著的
6、影响,因为这种差异也可能是由于抽样的随机性所造成的。在判断均值之间是否有差异时需借助于反映变异程度的指标——方差,所以叫方差分析。这个名字也表示:它是通过对数据误差来源的分析,来判断不同总体的均值是否相等。因此,进行方差分析时,需要考察数据误差的来源。关于误差组内误差(随机误差)同一水平(总体)下样本各观察值之间的差异这种差异可以看成是随机因素的影响,称为随机误差组间误差(随机误差、系统误差)不同水平(总体)下各观察值之间的差异这种差异可能是由于抽样的随机性所造成的——随机误差,也可能是由于品牌本身所造成的,
7、称为系统误差两个误差的比值若品牌对空调销售额没有影响,则组间误差中只包含随机误差,没有系统误差。这时,组间误差与组内误差的比值就会接近1;若品牌对空调销售额有影响,在组间误差中除了包含随机误差外,还会包含有系统误差,这时它们之间的比值就会大于1;当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响。三、方差分析的基本假定1.观测值是来自于服从正态分布总体的随机样本2.各总体的方差相同。3.各总体相互独立。四、方差分析的基本步骤第一步:提出假设第二步:构造检验统计量F第三步:
8、查表得Fα,进行统计决策(右侧检验)若F>F,则拒绝原假设若F
此文档下载收益归作者所有