欢迎来到天天文库
浏览记录
ID:14501793
大小:680.50 KB
页数:10页
时间:2018-07-29
《sas整理下之方差分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第四届经济与管理学院团支书联席会期末复习宝典六、方差分析1.单因素方差分析用INSIGHT进行分析1)整理所给数据,创立数据集。(在方差分析中,这第一步是非常重要的。我感觉,做单因素分析时创立的数据集中只有两列:一列是代表分类变量的,即科目,行业,编号等等,一定要用列名型;另一列是代表分析变量的,即所需要分析的具体数据,即分数,次数等等,一定要用区间型!!大家建完数据集之后自己可以检查下哈!!)2)在INSIGHT模块中打开数据集;3)选择菜单“Analyze(分析)”→“Fit(拟合)”,在打开的“Fit(XY)”
2、对话框中按图选择分析变量;注意:X中放分类变量,即列名型;Y中放分析变量,即区间型!!4)单击“OK”按钮,得到分析结果。5)结果分析:第一张表提供拟合模型的一般信息:第二张表为列名型变量信息;第三张表提供参数信息,并且约定,P_2、P_3、P_4、P_5分别标识变量(也称哑变量)。第四张表给出响应变量均值关于自变量不同水平的模型方程第五张表给出模型拟合的汇总信息,其中:R-Square(R2)是判定系数(coefficientofdetermination),阐明了自变量所能描述的变化(模型平方和)在全部变差平方和
3、中的比例,它的值总在0和1之间,其值越大,说明自变量的信息对说明因变量信息的贡献越大,即分类变量取不同的值对因变量的影响越显著。AajR-Sq(校正R2)是类似于R2的,但它随模型中的参数的个数而修正。第六张为方差分析表。从方差分析表可以看出,p值小于0.05(显著水平),所以拒绝原假设,即不同类别之间有显著差异;如果p值大于0.05,则不能拒绝原假设,不同类别之间无显著差异。第七张表提供III型检验,它是方差分析表的细化,给出了各因素的平方和及F统计量,因为本例是单因素的,所以这一行与上图的“Model”一行相同。
4、第八张为参数估计表,其中有关于不同行业下投诉次数差异的估计和检验:团支书联席会秘书长陈心一,副秘书长陈若曦、雷柯、厉洋军、张文昭呕血整理第四届经济与管理学院团支书联席会期末复习宝典1)根据标识变量的定义,Intercept后的估计47.4是对应于旅游业投诉次数的均值,其后的t检验是检验这一均值是否为0。这里p值<0.0001<0.05=α,故显著非0。2)航空后的估计-12.4是航空业与旅游业投诉次数均值之差的估计值,其后的t检验也是检验这两个投诉次数均值之差是否为0。由于p值的绝对值为0.1313>0.05,所以航
5、空业与旅游业的被投诉次数没有显著差异的。其它分析类似。6)检验模型假定:不要忘了哦!!为了验证残差为正态分布的假定,回到数据窗口。可以看到R_TOUSU(残差)和P_TOUSU(预测值)已加到数据集之中,下面用Distribufion(Y)来验证残差的正态性。1)选择菜单“Analyze(分析)”→“Distribution(Y)(分布)”;2)在打开的“Distribution(Y)”对话框中选定分析变量:R_TOUSU;单击“OK”按钮;3)选择菜单“Curves(线)”→“TestforDistribution
6、(分布检验)”;在打开的“TestforDistribution”对话框中直接单击“OK”按钮。在检验结果的“TestforDistribution”表中看到,p值大于0.05,不能拒绝原假设,表明可以认为残差是正态分布的;若p值小于0.05,则拒绝原假设,标明残差不是正态分布的。用“分析家”作单因素方差分析1)在“分析家”中,打开数据集;注意:建立数据集的方法同INSIGHT,这里就不重复了!2)选择菜单“Statistics(统计)”→“ANOVA(方差分析)”→“One-WayANOVA(单因素方差分析)”,打
7、开“One-WayANOVA”对话框;3)选中分类变量,单击“Independent”按钮,将其移到“Independent(自变量)”框中;选中分析变量,单击按钮“Dependent”,将其移到“Dependent(因变量)”4)为了检验方差分析中关于方差齐性的假定,单击“Tests”按钮,打开“One-WayANOVA:Tests”对话框,选中“Testsforequalvariance”栏下的“levene'stest”复选框(常用),如图左,单击“OK”按钮返回5)单击“Plots”按钮,打开“One-Way
8、ANOVA:Plots”对话框,可以选择图形类型,如选中“Typesofplots”栏下的“Box-&-whiskerplot”复选框,如图右,单击“OK”按钮返回;再次单击“OK”按钮。6)结果分析:结果分为五个部分,第一部分是因素水平的信息,可以看到只有一个分类变量因素,其中包含着几个水平,就是我们分类变量体现的几个种类。团支书联席会秘书长
此文档下载收益归作者所有