资源描述:
《c6多元回归分析报告报告材料-进一步地专地的题目》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实用标准文案第6章多元回归分析:进一步的专题摘要:本章进一步讨论若干多元回归分析问题,对实证分析很有帮助。6.1OLS统计量的数据缩放效应在C2中简单讨论了变量的单位变化对回归参数和R2值的影响。由于R2值实际上是y的拟合值和实际值相关系数的平方,所以其不会受数据缩放的影响。类似地,可以预期变量单位改变对回归参数及其标准误、回归标准误、置信区间、t统计量、F统计量的影响。见如下的例子:第二列改变了因变量的单位,从原来的盎司改为镑(数据缩小16倍);第三列改变吸烟量这个自变量的单位,从原来的日支数变为日包数
2、(数据缩小20倍)。相关回归结果如下表:精彩文档实用标准文案lBeta系数在某些实证分析中,自变量的现实意义是很难解释的,例如,在劳动经济学中,经常收集一些得分数据,这些数据变量的分数设置是很任意的,从而解释起来比较困难。此外,我们有时也希望了解不同类型的自变量在模型中的重要程度。此时,对因变量和自变量进行标准化后,再进行回归建模,可能是一个不错的选择。也就是,我们可以讨论自变量增加或减少一个标准差后给因变量带来的影响。有如下的OLS回归方程:yi=β0+β1xi,1+β2xi,2+…+βkxi,k+ui
3、,用它们的平均方程去减它们:yi-y=β1(xi,1-x1)+β2(xi,2-x2)+…+βk(xi,k-xk)+ui,精彩文档实用标准文案标准化后得到:yi-yσy=σx1β1σy(xi,1-x1)σx1+σx2β2σy(xi,2-x2)σx2+…+σxkβkσy(xi,k-xk)σxk+uiσy,或者改写成称:zy=b1z1+b2z2+…+bkzk+error.上述的Z变量分别被称为y和各个自变量的z-得分。问:哪些重要的统计量不会被改变?6.2函数形式的再讨论l对数函数形式讨论如下的回归方程:log
4、(price)=9.23-.718lognox+.306rooms,在该问题中由于rooms的变化单位是1,这是自变量的很大变化。在固定nox的前提下,100β2=100*.306来近似%∆y,可能不合适了,所以此时我们采用如下公式计算:%∆y=100*(expβ2∆x2-1),在此例子中,当增加1个房间时,%∆y=35.8%,而减少一个房间时,%∆y=-26.4%.对变量取对数的优点:1)正态化y(对称化,减小厚尾和异方差现象),使其更容易满足CLM;2)减小异常值的影响。l含二次函数(Quadrat
5、icfunctions)的模型二次函数可用于对单增或单减的边际效应的建模。若回归方程为:精彩文档实用标准文案y=β0+β1x+β2x2,∆y≈(β1+β2x)∆x,请解释该边际效应;如何解释二次函数最小值(怎么计算)两边的完全反向的边际效应。l带交叉项的模型(Modelswithinteractionterms)price=β0+β1sqrft+β2bdrms+β3sqrft*bdrms+β4bthrms,请解释上述回归方程中交叉项所表示的含义?我们更倾向于在均值(中值)、上四分位数或下四分位数处讨论模型
6、。因此,对回归模型:Stndfnl=2.05-.0067atndrte-1.63priGPA-1.28ACT+.296priGPA2+.0045ACT2+.0056priGPA.atndrte(1.36)(.0102)(.48)(.098)(.101)(.0022)(.0043)N=680,R-方=.229,修正R-方等于=.222;讨论priGPA的均值2.59处的偏效应,则有∆Stndfnl≈{-.0067+.0056*2.59+.0056(priGPA-2.59)}.∆atndrte={.0078+
7、.0056(priGPA-2.59)}.∆atndrte请检验.0078是否统计显著?6.3修正R-方R2=1-SSR/nSST/n,由此可以定义总体R2(populationR-squared):p2=1-σu2σy2,而其的一个合理估计是修正R2(adjustedR-squared)=R2=1-SSR/(n-k-1)SST/(n-1).精彩文档实用标准文案几点说明:1)R2仍然不是总体p2一个无偏估计;2)它在变元个数和SSR之间做了一个适当的权衡;3)一个新变量进入模型当且仅当其t值大于一个单位;一
8、组新变量进入模型当且仅当其联合显著性的F值大于一个单位;4)R2有时为负数。l应用修正R2来选择非嵌套模型非嵌套模型(nonnestedmodels)是指任意一个模型并不是其它模型的特例。有时变量间的共线性会使得本来显著的变量变成不显著,那么我们只能互斥性地选择其中的部分变量。此时,修正R-方比起R-方和F统计量都较优。但要注意,修正R-方只能在因变量都相同的非嵌套模型间做出选择。l在回归分析中控制了太多因素有时引入一个变量难