欢迎来到天天文库
浏览记录
ID:18831967
大小:153.80 KB
页数:7页
时间:2018-09-26
《统计学实验报告84067》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、统计学数学实验报告单因素方差分析姓名专业学号单因素方差分析摘要统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释数据并从数据中得出结论的方法,统计研究的是来自各个领域的数据。单因素方差分析也是统计学分析的一种。单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。关键字单因素、方差、数据统计方差分析(analysisofvariance,ANOVA)就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。当方差分析中之涉及一个分类型自变量时称为单因素方差分析(one-wayanalysisofvariance).单因素方差分析研究的是一个
2、分类型自变量对一个数值型因变量的影响。例如要检验汽车市场销售汽车时汽车颜色对销售数据的影响,这里只涉及汽车颜色一个因素,因而属于单因素方差分析。为了更好的理解单因素方差分析,下面举个例子来具体说明单因素方差所要解决的问题。从3个总体中各抽取容量不同的样本数据,结果如下表1所示。检验3个总体的均值之间是否有显著差异(α=0.01)P29210.1样本1样本2样本3158153169148142158161156180154149169如果要进行单因素方差分析时,就需要得到一些相关的数据结构,从而对那些数据结构进行分析,如下表2所示:分析步骤1.提出假设与通常的统计推断问题一样,方差分析的任务也
3、是先根据实际情况提出原假设H0与备择假设H1,然后寻找适当的检验统计量进行假设检验。本节将借用上面的实例来讨论单因素试验的方差分析问题。 表中的数据可以看成来自s个不同总体(每个水平对应一个总体)的样本值,将各个总体的均值依次记为,则按题意需检验假设 不全相等2.构造检验的统计量(1)计算个样本的均值假如从第个总体中抽取一个容量为的简单随机样本,令为第个总体样本的样本均值,则有其中:式中,为第个总体的样本量的第个观测值。例如根据上表1中的数据,分别计算三个样本的均值为:样本1的均值158由此可得样本2、样本3的均值分别为150,169(2)计算全部观测值的总均值。它是全部观测值的总和除
4、以观测值的总个数,令总均值为,则公式为根据上表1中的数据我们可得出三个样本的总均值为(3)计算各误差平方和为构造检验计算量,在单因素方差分析中,需要计算三个误差平方和,即总平方和、组建平方和(因素平方和)、组内平方和(误差平方和或残差平方和)。①总平方和(sumofsquaresfortotal),记为SST,它是全部观测值与总观测值的误差平方和,其计算是为例如在前面式中我们已经计算出,计算出的总平方和为1216.918②组间平方和(sumofsquaresforfactorA),记为SSA。它是各组均值()与总均值的误差平方和,反映各个样本之间的差异程度,因此又称为因素平方和。其计算公式为
5、例如根据上面计算的有关结果,计算组建平方和为618.918③组内平方和(sumofsquaresforerror),记为SSE。它是每个水平或组的各样本数据与其组均值的误差平方和,反映每个样本观测值的离散状况。该平方和反映了随机误差的大小,其计算公式为:在上例中先求出各样本数据与其均值的误差平方和,然后将三个误差平方和加总,即SSE。计算误差平方和分别为:样本1:246由此可得,样本2、样本3的误差平方和为110,242然后将其加总可以得到:246+110+242=598上述三个平方和的关系为++即总平方和(SST)=组间平方和(SSA)+组内平方和(SSE)从上面计算结果也可以证明这一点:
6、1216.918=618.918+598(4)、计算统计量三个平方和所对应的自由度分别为:SST的自由度为n-1,其中n为全部观测值的个数。SSA的自由度为k-1,其中k为因素水平(总体)的个数。SSE的自由度为n-k。由于要比较组内均方与组间均方之间的差异,所以通常只能计算SSE的均方与SSA的均方。SSA的均方也称为组间均方或者组间方差,记为MSA,其计算公式为:例如,根据例题计算的MSA为:459SSE的均方差也称为组内均方或者组内方差,其计算公式为:将上述与与进行对比,即得到所需要的检验统计量F。当为真时,二者的比较服从分子自由度为、分母自由度为根据本例计算,得:二、统计决策根据给定
7、的显著性水平α,在分布表中查找分子自由度、分母自由度。若之间有显著差异,检验的因素对观测值有显著影响。若之间有显著差异,即这时还不能认为所检验的因素对观测值有显著的影响。根据上面的计算结果,计算出的。若取显著性水平α=0.01,分子自由度=3-1=2和分母自由度,查F分布表得到临界值4.2365.则F>Fα,即所检验的因素对观测值有显著的影响。二、用Excel进行方差分析操作步骤:第1步:选择【工具】下拉菜单
此文档下载收益归作者所有