欢迎来到天天文库
浏览记录
ID:34625245
大小:230.90 KB
页数:8页
时间:2019-03-08
《使用统计软件r进行多元回归分析new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、使用统计软件R进行多元回归分析李秀敏,蔡霞(河北科技大学理学院,河北石家庄050018)摘要:多元回归分析是计量经济中重要的模型之一,在实际工作中有着广泛的应用;统计软件在处理数据时显示出越来越重要的作用。本文详细介绍如何用统计软件R,建立回归分析模型,并解读统计分析结果。关键词:统计软件R;回归分析模型;共线性中图分类号:O245文献标示码:A1.统计软件R简介软件R最初是由新西兰奥克兰大学的RossIhaka和RobertGentleman两位学者建立的统计分析及图形处理软件。它是通过计算机网络在GeneralPublicLicence(GPL)下自由发行的,可以免
2、费使用。RossIhaka和RobertGentleman出于教学的目的,对S语言(后来发展称为20世纪80年代的商业软件S-PLUS)进行了简化,称为R语言。R语言自带许多功能强大的统计软件包,这些软件包是由许多不同领域的专家学者奉献的。除了一些常用的软件包如回归分析、方差分析等等以外,R还包含统计领域中较新的研究成果,如极值统计软件包、相关结构Copula软件包等。R语言的安装文件,不管是源代码形式还是二进制形式都可以从因特网ComprehensiveRArchiveNetwork(CRAN):http://cran.r-project.org上免费下载。安装R如同
3、一般的Windows软件一样,回车就可以。R对数据的统计分析是通过程序命令完成的,快捷方便。下面以回归分析为例,介绍如何用R进行软件求解,并解读统计分析结果。本文假设读者已具有回归分析的理论知识。2.多元线性回归分析理论概述多元线性回归分析是研究一个响应变量与多个自变量间呈线性相关关系的问题,这种关系可以用多元线性回归方程来描述:yˆˆˆxˆxˆx01122kk式中ˆ为回归常数项,ˆ(i1,2,,)k称为偏回归系数,其意义为当其它自变量对响应变0i量的影响固定时,ˆ对应的第i个自变量x对y的线性影响程度。ii【案例1】财政收入的多因素分析在一
4、定时期内,财政收入y(亿元)受许多因素影响,本例取税收收入x(亿元)、国11内生产总值x(亿元)作为自变量,分析它们对财政收入的影响。数据来源于《中国统计2年鉴》,数据时限为1978年到1995年。2.1数据的输入:向R中输入数据可以有多种方法,如果数据较少时,可以从键盘直接输入,下面是从放在d盘上的用记事本形式记录的一个数据框架shuju.txt,命令语句为:income=read.table("d:/shuju.txt",col.names=c("y","x1","x2")),输出结果为:>incomyx1x211132.623624.1519.2821146.38
5、4038.2537.8231159.934517.8571.70164348.9534650.54255.30175218.1046532.95126.88186242.2057277.36038.04输出结果的最左边一列表明数据的长度,在这里就是样本容量的大小。2.2线性回归分析:线性回归分析的命令语句简捷明了,命令语句为:lm.income=lm(income$y~income$x1+income$x2)summary(lm.income)#显示回归结果输出结果为:Call:lm(formula=income$y~income$x1+income$x2)Res
6、iduals:Min1QMedian3QMax-140.03-75.76-15.1251.81456.77Coefficients:EstimateStd.ErrortvaluePr(>
7、t
8、)(Intercept)8.036e+026.844e+0111.7425.82e-09***income$x16.082e-029.781e-036.2181.65e-05***income$x23.233e-019.134e-023.5400.00297**---Signif.codes:0'***'0.001'**'0.01'*'0.05'.'0.1''1Residualst
9、andarderror:144.7on15degreesoffreedomMultipleR-Squared:0.9915,AdjustedR-squared:0.9904F-statistic:873.4on2and15DF,p-value:2.992e-16从输出结果可以看出,回归方程为y803.60.06x0.32x,变量x和x的t统计量1212的估计值分别为6.218和3.540,由对应的p值都比显著性水平0.05小,可得两个偏回归系22数在显著性水平0.05下均显著不为零。进一步地剩余方差的估计值ˆ144.7,F统计2
此文档下载收益归作者所有