欢迎来到天天文库
浏览记录
ID:48825033
大小:633.00 KB
页数:60页
时间:2020-01-30
《第9章 含定性变量的回归模型.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第九讲虚拟变量模型的进一步讨论——含定性变量的回归模型9.1自变量中含有定性变量的回归模型9.2自变量定性变量回归模型的应用9.3因变量是定性变量的回归模型9.4Logistic(逻辑斯蒂)回归9.5多类别Logistic回归9.6因变量是顺序变量的回归§9.1自变量中含有定性变量的回归模型一、简单情况首先讨论定性变量只取两类可能值的情况,例如研究粮食产量问题,y为粮食产量,x为施肥量,另外再考虑气候问题,分为正常年份和干旱年份两种情况,对这个问题的数量化方法是引入一个0-1型变量D,令:Di=1表示正常年份Di=0表示干旱年份§9.1自
2、变量中含有定性变量的回归模型粮食产量的回归模型为:yi=β0+β1xi+β2Di+εi其中干旱年份的粮食平均产量为:E(yi
3、Di=0)=β0+β1xi正常年份的粮食平均产量为:E(yi
4、Di=1)=(β0+β2)+β1xi§9.1自变量中含有定性变量的回归模型例9.1某经济学家想调查文化程度对家庭储蓄的影响,在一个中等收入的样本框中,随机调查了13户高学历家庭与14户中低学历的家庭,因变量y为上一年家庭储蓄增加额,自变量x1为上一年家庭总收入,自变量x2表示家庭学历,高学历家庭x2=1,低学历家庭x2=0,调查数据见表9.1:
5、§9.1自变量中含有定性变量的回归模型序号y(元)x1(万元)x212352.3023463.2133652.8044683.5156582.6068673.21710852.602389503.902498654.802598664.6026102354.8027101404.20表9.1§9.1自变量中含有定性变量的回归模型在线性回归对话框,建立y对x1、x2的线性回归,输出结果:§9.1自变量中含有定性变量的回归模型两个自变量x1与x2的系数都是显著的,判定系数R2=0.879,回归方程为:=-7976+3826x1-3700x2§
6、9.1自变量中含有定性变量的回归模型这个结果表明,中等收入的家庭每增加1万元收入,平均拿出3826元作为储蓄。高学历家庭每年的平均储蓄额少于低学历的家庭,平均少3700元。如果不引入家庭学历定性变量x2,仅用y对家庭年收入x1做一元线性回归,得判定系数R2=0.618,拟合效果不好。§9.1自变量中含有定性变量的回归模型自变量x1的系数是显著的,回归方程为:=-7728+3264x1§9.1自变量中含有定性变量的回归模型家庭年收入x1是连续型变量,它对回归的贡献也是不可缺少的。如果不考虑家庭年收入这个自变量,13户高学历家庭的平均年储蓄增
7、加额为3009.31元,14户低学历家庭的平均年储蓄增加额为5059.36元,这样会认为高学历家庭每年的储蓄额比低学历的家庭平均少5059.36-3009.31=2050.05元,而用回归法算出的数值是3824元,两者并不相等。回归方程为:§9.1自变量中含有定性变量的回归模型用回归法算出的高学历家庭每年的平均储蓄额比低学历的家庭平均少3700元,这是在假设两者的家庭年收入相等的基础上的储蓄差值,或者说是消除了家庭年收入的影响后的差值,因而反映了两者储蓄额的真实差异。而直接由样本计算的差值2050.05元是包含有家庭年收入影响在内的差值,
8、是虚假的差值。所调查的13户高学历家庭的平均年收入额为3.8385万元,14户低学历家庭的平均年收入额为3.4071万元,两者并不相等。§9.1自变量中含有定性变量的回归模型二、复杂情况某些场合定性自变量可能取多类值,例如某商厦策划营销方案,需要考虑销售额的季节性影响,季节因素分为春、夏、秋、冬4种情况。为了用定性自变量反应春、夏、秋、冬四季,我们初步设想引入如下4个0-1自变量:§9.1自变量中含有定性变量的回归模型可是这样做却产生了一个新的问题,即x1+x2+x3+x4=1,构成完全多重共线性。解决这个问题的方法很简单,我们只需去掉一
9、个0-1型变量,只保留3个0-1型自变量即可。例如去掉x4,只保留x1、x2、x3。对一般情况,一个定性变量有k类可能的取值时,需要引入k-1个0-1型自变量。当k=2时,只需要引入一个0-1型自变量即可。§9.2自变量定性变量回归模型的应用一、分段回归例9.2表9.3给出某工厂生产批量xi与单位成本yi(美元)的数据。试用分段回归建立回归模型。序号yX(=x1)x212.5765015024.4340034.52400041.3980030054.75300063.555707072.4972022083.774800§9.2自变量定性
10、变量回归模型的应用图9.1单位成本对批量散点图§9.2自变量定性变量回归模型的应用由图9.1可看出数据在生产批量xp=500时发生较大变化,即批量大于500时成本明显下降。我们考虑由两段构成的
此文档下载收益归作者所有