资源描述:
《Excel多元线性回归在数据分析中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、...Excel多元线性回归在数据分析中的应用Excel多元线性回归在数据分析中的应用摘要:Excel功能强大,利用它的分析工具和函数,可以进行各种试验数据的多元线性回归分析。希望本文能为人们提供一些有益的参考。关键词:Excel;多元线;数据前言:计算机在各个领域中的应用日益广泛。Excel是office办公软件的一个重要组件,它的界面友好,可操作性强,使用方便而被广大用户接受。所以我为了解并得到一些这方面的知识,选了这个题目。本文中我还引用了一些专家的想法。我主要讨论Excel在多元线性回归在数据分析中的应用,以希望对广大的使
2、用者有所帮助。1Excel中数据分析和函数的安装启动Excel,查看“数据分析”和“粘贴函数”选项是否安装。如果安装,单击“工具”下拉菜单中的“加载宏”选项,在“加载宏”对话框加选取“分工具库”和“分析数据库一VBA函数”,单击确定,“数据分析”和“粘贴函数”安装就绪,便可以使用了。2塔里木农垦大学植物科技学院的曹新川对这个题目有此看法;Excel下多元线性回归分析的实现2.1数据输入和常量定义原始数据输完后,就可以进行常量定义了。常量定义有两种方法:第一种:选取x.下的数据,单击菜单栏的“插人”,然后单击下拉菜单中的“名称”,再
3、单击子菜单的“指定”,对数组x.进行常量定义,同样可分别对X2,X3,X4,Y进行常量定义。第二种:单击菜单栏的“插人”,然后单击下拉菜单中的“名称”,再单击子菜单中的“定义”对常量进行定义,也就是对每个变量进行赋值的过程。完成定义以后,就可以用生物统计学中惯用的符号进行统计分析。2.2一级数据的产生此步骤可以省略,在此仅简要说明如何套用公式计算一级数据,在第一例输人要计算的变量,如“Σx,1”在其后第二列输人“=sum(x1),”即对xl进行求和,在第一列输人“Σx2”,其后第二列输人“sumsq~(x1),即算出x的平方和,这
4、样可以算出所有的一级数据。数据计算出来,即用常量定义的第二种方法,对每一个变量进行赋值。3青海省统计局的高平用下列方法实现Excel多元线性回归在数据分析中的应用:在一元线性回归分析中,重点放在了用模型中的一个自变量X来估计因变量Y。实际上,由于客观事物的联系错综复杂,一个因变量的变化往往受到两个或多个自变量的影响。为了全面揭示这种复杂的依存关系,准确地测定它们的数量变动,提高预测和控制的精确度,就要考虑更多的自变量,建立多元回归模型。多元回归分析的原理和方法同一元线性回归分析基本相同,但有两个不同点:3.1不能用散点图来表示变量
5、之间的关系。......3.2多元回归的计算难度要远大于简单线性回归,且变量越多,计算越复杂。但应用EXCEL来完成计算将变得简单和轻松。以下图中的数据为例:多元线性回归的EXCEL数据分析操作方法首先单击工具栏,在弹出的菜单中选择“数据分析”在,数据分析工具的选项框中选中“回归”然,后在输入、输出选项以及有关的选项框中进行适当的选择,必须注意在进行自变量X的输入时要按照已经确定的各个自变量的顺序把所有自变量的单元格引用范围一起放在X值的输入区域内。见下图:......点击“确定”按钮,即可得到线性回归分析的结果。见下图:3。3根
6、据上图中的显示结果,可直接写出二元线性回归方程:Yi=b0+b1X1i+b2X2i=-51.3127+1.4053x1i+6.3823x2ib1表示在促销费用固定时,商店的规模大小每增加1平方米,年销售额平均增加1.4053万元;b2表示在商店的规模大小固定时,促销费用每增加1万元,年销售额平均增加6.3823万元。这里b1即商店的规模大小的回归系数比一元线性回归方程中的回归系数b=1.6246小,是因为一元线性回归方程只考虑了商店的规模大小对年销售额的影响,忽略了促销费用这一很重要的因素,在商店的规模大小的影响中渗入了促....
7、..销费用的影响。这里的截距b0=-51.3127万元,与一元线性回归方程中的截距+99.01万元有很大的不同,因为X1=0和X2=0都不在X1、X2的样本取值范围之内,因而对截距项的解释要非常谨慎。判定系数等于85.14%,表明在年销售额的变动中,有85.14%可由商店规模大小和促销费用多少这两个因素的变动来解释,只有14.86%的因素属于随机误差。引进了第二个自变量之后,回归方程的判定系数85.14%,比一元线性回归方程的判定系数77.68%提高了7.46个百分点。但需注意,在一般情况下,增加自变量,即使这个自变量在统计上并不
8、显著,也会使判定系数的值增大。年平均销售额的估计标准误差为112.1015万元,引进了第二个自变量促销费用之后,回归方程的估计标准误差比一元线性回归方程的估计标准误差131.99万元有了下降,说明多元线性回归方程的代表性高于一元线性回归方程。设显著