资源描述:
《统计软件实验教学要件实验项目十四r软件环境下的回归分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实验项目十四R软件环境下的回归分析一、实验目的运用R中的cor()和cor.test()函数进行一般相关分析;运用pcor()和poor,test()函数进行偏相关分析;运用lm()函数来实现线性回归分析,运用glm()函数来完成Logistic回归分析;宵利用predict()函数来求预测值和预测区间,并能读懂R输出的结果。二、实验环境肯系统软件Windows2000或WindowsXP或Windows7;宵统计软件R2.13.2或更高版本。三、实验内容运用R进行相关分析和回归分析变量散点图的绘制简单相
2、关系数的计算和偏相关系数的计算—元线性回归的估计多元线性回归的估计虚拟变量回归的估计Logistic回归的估计回归曲线的估计第14章回归分析肯14.1相关分析^14.2一元线性回归^14.3多元线性回归^14.4虚拟变量回归皆14.5Logistic回归^14.6曲线回归14.1相关分析皆【例14.1](数据文件为lil4.l.txt)为研究初中一年级男生身高x(单位:厘米)、体重z(单位:千克)和肺活量y(单位:升)的关系,随机抽取了16名初一男生测量得有关数据如表14.1所示:表14.1初一男生身高、
3、体重和肺活量的测量值【统计理论】宵给定容量为n的一个样本,样本简单相关系数(correlationcoefficient)厂的计算公式如下【统计理论】肯设三个变量〔y和z是相互关联的一组变量,那么,在控制了变量z的影响后,变量x和y的偏相关系数(partialcorrelationcoefficient)为:(1)画散点图,观察身高儿体重z和肺活量y之间的相关关系【软件操作】bR软件plot()函数可以绘制散点图驴setwd("D:/R~Statistics/data/chap-14u)#设定工作路径皆p
4、lot(dat$X,dat$Z)肯plot(dat$X,dat$Y)窃plot(dat$Y,dat$Z)运行结果#绘制身高/和体重z的散点图#绘制身高x和肺活量y的散点图#绘制肺活量y和体重z的散点图。(2)R软件cor()函数cor.test()函数可以计算变量的相关系数并进行显著性检验【软件操作】运行结果运行结果(3)R软件poor()函数poor,test()函数可以计算变量的偏相关系数并进行显著性检验【软件操作】运行结果运行结果运行结果14.2-元线性回归&【例14.2](数据文件为lil4・2.
5、txt)表14.2是《华尔街日报1999年年鉴》(TheWa11StreetJournalAlmanac1999)上公布的美国各航空公司业绩的统计数据:航班正点到达的比率和每10万名乘客投诉的次数。表14.2美国航空公司航班正点率与乘客投诉率【统计理论】奇设y与x之间有直线相关关系,且y是随机变量,但/是非随机变量,它们之间的关系可以用下式表示:【统计理论】宵采用最小二乘方法可以得到回归系数的估计值为:皆从而得到回归方程:【统计理论】皆回归方程的显著性检验等价于以下检验:与对于一元线性回归来说,有两种等价
6、的方法,即尸检验和广检验。F检验的统计量为:皆广检验的统计量如下:【统计理论】(1)绘制变量散点图计算相关系数和一元线性回归【菜单方式】皆setwd("D:/R-Statistics/data/chap-14'r)#设定工作路径^dat=read.table(nlil4.2.txt",header二T)#从lil4.2.txt中读入数据,记为datbplot(y~x,data二dat)#绘制x和y的散点图肯cor(dat)#计算x和y的相关系数运行结果【菜单方式】itlm=lm(y"x,data=dat)
7、#建立y关于x的回归方程^anovaCfitlm)#输出回归方程的方差分析表肯summary(fitlm)#输出回归分析结果。运行结果运行结果(2)如果航班正点率为80%,对每10万名乘客投诉的次数进行预测【菜单方式】育newdat二data,frame(x=80)#给定x的值为80,记为newdat肯predict(fitlm,newdat,interval二"predict")#对y的个值进行预测^predict(fitlm,newdat,interval=^confidencew)#对y的均值进行估
8、计。运行结果6.3多元线性回归皆【例14.3](数据文件为lil4.3・txt)某公司经理想研究公司员工的年薪问题,根据初步分析,他认为员工的当前年薪y(元)与员工的开始年薪简(元)、在公司的工作时间应(月)、先前的工作经验如(月)和受教育年限乂(年)有关系,他随机抽样调查了36个员工,收集到表14.3数据(略)。【统计理论】肯多元线性回归统计模型的一般形式为:肯模型的基本假定为:皆(1)且相互独立;宵(2)自变量是非随机的,