欢迎来到天天文库
浏览记录
ID:59209333
大小:845.50 KB
页数:33页
时间:2020-09-26
《第6章 多元回归分析其他问题ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第六章多元回归分析:其他问题本章讨论多元回归方法在应用中的一些问题6.1测度单位对OLS统计量的影响6.2对函数形式的进一步讨论6.3拟合优度和回归元选择的进一步讨论6.4多重共线性6.5预测和残差分析6.6案例研究6.1测度单位对OLS估计量的影响当变量重新测度时,系数、标准误、置信区间、t统计量和F统计量改变的方式,都不会影响所有被测度的影响程度和检验结果。以例说明:因变量测度单位的变化的影响自变量测度单位的变化的影响贝塔系数:有时反映关键变量影响的斜率系数是一个难以解释的度量,如考试分数等。此时采用标准化系数或贝塔系数可能有帮助。设原始方程为6.1测度单位对OLS估计量的影响进行标准化后
2、的回归为:标准化系数与原系数的关系为:解释为xj增加一个标准差,因变量增加的标准差个数。标准化系数不受变量测度单位的影响,可以用来判断解释变量的重要性。例6.1中利用标准化系数可说明,污染比犯罪对房价产生更大的影响。标准化系数存在使用不方便的缺点。6.2函数形式的进一步讨论对数函数形式:对以下模型的系数进行解释:Rooms前面的系数常解释为,多增加一个房间,结果会提高30.6%,但这种解释是近似的,精确应该是:以上的调整对小的百分数变化而言不那么重要。在应用研究中广泛应用对数形式的原因:使用对数对系数的解释具有吸引力,且不受测度单位影响使用对数比使用水平的因变量更接近CLM假定,如缓和异方差和
3、偏态性。取对数可缩小变量取值范围,减弱对异常值的敏感度。6.2函数形式的进一步讨论使用对数形式的经验法则:对金额表示的变量通常可以取对数。对人数、雇员总数和学校注册人数等变量可取对数。以年度量的变量(受教育年限、工作经历、任职年限和年龄等)通常用原形。比例或百分比变量(如失业率、参与率、拘捕率和通过率等)既可使用原形,也可使用对数,但要区分百分点的变化与百分比的变化。6.2函数形式的进一步讨论使用对数形式的局限:变量不能取零或负值,有时可用:使用对数形式的因变量,难以预测原变量的值。以y作为因变量的模型与以log(y)作为因变量的模型,不能比较R2,没有直接方法比较两种模型优劣含二次型的模型:
4、为了描述递减或递增的边际效应,常使用二次型:6.2函数形式的进一步讨论边际效应的形式为:可代入样本中的x的平均值、中位数或上下四分位数。在多数应用中,常为正,而为负,此时具有抛物线形态,存在一个转折点:当模型中因变量为对数形式,而自变量以二次形式出现时,解释需要小心,如例6.2。对数形式的二次型可说明弹性是非参数的。6.2函数形式的进一步讨论含有交互作用项的模型:因变量对一个解释变量的偏效应、弹性或半弹性可能受另一解释变量的影响,这就需要交互项的使用。如:Bdrms对price的偏效应为:例6.3解释6.3拟合优度和回归元选择的进一步讨论初学者往往倾向于过度强调R-平方,有些情况下R-平方可能
5、人为地偏高,低R-平方只是说明仍有一些影响y的因素没有被解释,但并不意味着u中的因素与现有的自变量相关,零条件均值假定决定了,我们可以对现有自变量的偏效应进行良好的估计,这是回归模型的核心,而R-平方的大小与此无直接关系。调整的R-平方:为了克服模型只要增加新的自变量,R-平方不会变小,且对增加自变量所带来的自由度的损失进行惩罚,调整的R-平方被采用:6.3拟合优度和回归元选择的进一步讨论当且仅当新的自变量的t统计量的绝对值大于1时,调整的R-平方才会增加(对此推广是,在回归中增加一组变量时,当且仅当这些新变量的联合显著性检验的F统计量大于1时,调整R-平方才会增加)。由此,使用调整的R-平方
6、来决定一变量(或一组变量)是否属于模型,与标准的t或F检验是不同的。利用调整的R-平方在非嵌套模型中选择:F统计量只能让我们检验嵌套模型(nestedmodels):一个模型(受约束模型)是另一个模型(不受约束模型)的一种特殊情况。6.3拟合优度和回归元选择的进一步讨论非嵌套模型:对于非嵌套模型(nonnestedmodels)的选择是一个很困难的问题。因变量相同模型的一种可能的方法是,创造一个包含原来二个模型中所有解释变量的复合模型,然后采用F检验将原来的每个模型针对复合模型进行检验。此方法的问题是,两个模型既可能同时被拒绝,也可能同时均不被拒绝。利用调整的R-平方可以对非嵌套模型进行选择,
7、但不能用于因变量不同的模型之间进行选择。如水平模型和对数模型之间的选择。例6.46.3拟合优度和回归元选择的进一步讨论回归分析中控制了过多的因素:在担心模型中漏掉一个可能与自变量相关的重要因素的同时,还有另一种可能性:回归分析中控制过多的变量。对多元回归模型中其他条件不变的解释有时能帮助我们避免此类错误,以评价州啤酒税对交通死亡率影响的模型为例:关键是是否要加入啤酒消费量这个控制变量?加入后如何解
此文档下载收益归作者所有