第十一章 多元线形回归分析

第十一章 多元线形回归分析

ID:6163850

大小:92.00 KB

页数:7页

时间:2018-01-05

第十一章  多元线形回归分析_第1页
第十一章  多元线形回归分析_第2页
第十一章  多元线形回归分析_第3页
第十一章  多元线形回归分析_第4页
第十一章  多元线形回归分析_第5页
资源描述:

《第十一章 多元线形回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十一章多元相关与回归分析第一节多元线性回归模型多元线性回归即多个自变量对一个因变量的线性回归。一、多元线性回归模型概念以两个自变量的二元回归为例,如X1、X2和Y的关系存在关系式:E(Y)=α+β1X1+β2X2,则Y与X1和X2之间存在多元线性相关关系,这一方程即多元线性回归模型。多元线性回归是多维空间中的超平面,如二元回归是三维空间中的一个平面。对于任意的(X1,X2),Y的期望值就是该平面上正对(X1,X2)的那个点的Y轴值,其与实际观测点之间存在随机误差,实际观测点Yi=α+β1X1+β2X2+εi。二、模型的建立总体未知情况下,以样本构造出一个平面来估计总体真实平面,即以平

2、面ŷ=a+b1x1+b2x2去拟合原始观测数据。拟合的准则是最小二乘法原理,使各观测值距离拟合值的偏差平方和最小,即∑(yi-ŷ)2最小。由此计算出的a,b1,b2是对α,β1,β2的最佳估计。例如对施肥量X1、降雨量X2和产量Y的数据,SPSS输出结果(表1):VariableBSE.BBetaTX13.810.5830.596.532X23.330.6170.495.4Constant266.732.0778.313即得到ŷ=266.7+3.81x1+3.33x2三、回归系数的意义对于模型ŷ=a+b1x1+b2x2,b1可以解释为:当X2不变的情况下,X1每变化一个单位,Y将平均发

3、生b1个单位的变化。如果所有自变量都同时变化,那么ΔY=b1ΔX1+b2ΔX2+….biΔXi。例题:如果对产量、施肥量、降雨量做出了简单回归和多元回归模型:A模型:产量=287+5.9施肥量;B模型:产量=400+6.0降雨量;C模型:产量=267+3.81施肥量+3.33降雨量;请计算:(1)如果在每亩土地上多施10斤肥料,可以期望产量增加多少?(2)如果在每亩土地上多灌溉5厘米的水,可以期望产量增加多少?(3)如果同时在每亩土地上多施10斤肥料,并且多灌溉5厘米的水,可以期望产量增加多少?(4)由原始数据发现较高的施肥量和较高的降雨量是有联系的,如果照这样的趋势下去,那么在每亩土

4、地上多灌溉5厘米的水,可以期望产量增加多少?解:(1)ΔY=3.81(10)=38.1斤。(2)ΔY=3.33(5)=16.65斤。(3)ΔY=3.81(10)+3.33(5)=38.1+16.65=54.75斤(4)ΔY=6.0(5)=30斤。采用B模型中的简单回归系数6.0,它表示当施肥量也变化时,产量怎样随着降雨量的变化而变化。比较题2和题4,30斤的增产不只归功于降雨量,也包含施肥量的影响;而16.65斤的增产则是在施肥量不变的情况下,伴随着降雨量的增加而产生的。四、自变量为定类变量时回归系数的解释线形回归要求自变量和因变量都是定距变量,但当自变量为二项变量或定类变量时,可以将

5、其转化为0-1变量/虚拟变量后再进行回归。1、自变量为二项变量时:如研究存款额Y(百元)和年龄X1、性别X2之间的关系,令男性=1,女性=0(对照组)。如果得到如下多元回归方程:ŷ=33+12x1-9.1x2,则x2的回归系数-9.1表示,对于同年龄的人来说,男性的存款额比女性平均减少910元。1,中学0,其他1,大学0,其他2、自变量为定类变量时:如研究收入Y(百元)和文化程度X之间的关系,假设文化程度包括小学、中学、大学,可将文化程度转化为两个虚拟变量,D1=D2=,D1=D2=0代表小学程度(对照组),D1=1,D2=0表示中学文化程度;D1=0,D2=1表示大学文化程度。假如得

6、到回归方程ŷ=33+12D1+30D2,D1的回归系数表示中学文化程度的人比小学文化程度的人收入平均多1200元;D2的回归系数表示大学文化程度的人比小学文化程度的人收入平均多3000元。3、如果自变量为连续变量,但其与因变量的关系并不是线形关系,例如年龄X和身高Y的关系,可以把年龄划分成年龄段做为定类变量。对于有个水平的定类变量,需要设计n-1个虚拟变量来描述。第二节多元线性回归模型检验一、回归系数的估计和检验在多元回归中,各个回归系数的估计值b1,b2…都围绕总体回归系数β1,β2…近似正态波动,所以可以用样本回归系数的标准误差来构造总体回归系数的置信区间。标准误差为表1中的第二列

7、输出结果SE.B。总体回归系数置信区间公式:βi=bi±tα/2SEi,其中,i=1,2,….k;查t分布表时的自由度为n-k-1。例题:以表1为例,计算每个回归系数的95%的置信区间(k=1,2),已知n=7:解:df=7-2-1=4;查表得t0.025=2.776;β1=3.81±2.776(0.583)=3.81±1.618;β2=3.33±2.776(0.617)=3.33±1.713对回归系数进行检验即检验H0:βi=0;H1:βi≠

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。