资源描述:
《计量经济学导论-伍德里奇02》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、横截面数据的回归分析简单回归模型简单回归的术语1在简单线性回归模型(thesimplelinearregressionmodel)Y==β0+β1X+uY被称为–因变量(DependentVariable),或–被解释变量(ExplainedVariable),或–响应变量(responsevariable),或–回归子(Regressand)2简单回归的术语2在简单线性回归模型(thesimplelinearregressionmodel)Y=β0+β1X+u(2.1)X被称为–自变量
2、(independentvariable),或–解释变量(explanatoryvariable),或–控制变量(control1variable),或–回归元(Regressor),或–协变量(covariate)3变量u被称为关系式中的误差项(errorterm)或者干扰项(disturbance),表示除X之外其他影响y的因素。简单回归分析有效地把除X之外其他所有影响y的因素都看成无法观测的因素。保持u中其他因素不变,β1是Y和X的关系式中的斜率参数(slopeparameter),β0
3、被称为截距参数(interceptparameter)例2.1大豆收成与施肥量假设大豆收成由以下模型所决定:yield=b0+b1fertilizer+u(2.2)于是,y=收成(yield),而x=施肥量(fertilizer)。农业研究者感兴趣的是,在其他因素不变的情况下,施肥量如何影响大豆收成。这个影响由b1给出,误差项u包括了诸如土地质量、降雨量等因素。系数b1度量了在其他条件不变的情况下施肥量对产出量的影响:简单假设假设总体中u的平均值为0,即E(u)=0(2.3)式(2.3)
4、的约束性不是特别强,我们可以用b来进行标准0化,令(2.3)成立。6对解释变量的假设假设1、解释变量X是确定变量,不是随机变量;假设2、解释变量X在所抽取的样本中具有变异性,随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。即;假设3旨在排除时间序列数据出现持续上升或下降的变量作为解释变量,因为这类数据不仅使大样本统计推断变得无效,而且往往产生所谓的伪回归问题(spuriousregressionproblem)。对随机干扰项的假设假设3、随机误差项µ具有零均值、同方差和不序列相关性:E
5、(µi)=0i=1,2,…,nVar(µi)=σµ2i=1,2,…,nCov(µi,µj)=0i≠ji,j=1,2,…,n假设4、随机误差项µ与解释变量X之间不相关:Cov(Xi,µi)=0i=1,2,…,n假设5、µ服从零均值、同方差、零协方差的正态分布µi~N(0,σµ2)i=1,2,…,n以上假设也称为线性回归模型的经典假设或高斯(Gauss)假设,满足该假设的线性回归模型,也称为经典线性回归模型(ClassicalLinearRegressionModel,CLRM)。在施肥的例子中,如果
6、施肥量与该地区的其他条件没有关系,那么式E(u
7、X)=E(u)成立:土地的平均质量不会依赖于施肥量。然而,如果更多的肥料被施用在更高质量的土地上,那么u的期望值就会随着肥料的用量而改变,式E(u
8、x)=E(u)也就不成立了。式(2.4)表明,总体回归函数(populationregressionfunction,PRF)E(y
9、x)是x的一个线性函数。线性意味着x变化一个单位,将使y的期望值改变β1之多,如下图所示,对任何给定的X值,y的分布都以E(Y
10、X)为中心。E(y
11、x)asalinearf
12、unctionofx,whereforanyxthedistributionofyiscenteredaboutE(y
13、x)yf(y).E(y
14、x)=β+βx.01x1x211最小二乘法(OrdinaryLeastSquares)令{(X,Y):i=1,…,n}表示从总体中抽取的一个容量为n的随ii机样本,样本的每个观测,一元线性回归模型可以写为Yi=β0+β1Xi+ui这里,u包括除X之外所有影响Y的因素,所以它是第i次iii观测的误差项。12Populationregressionline
15、,sampledatapointsandtheassociatederrortermsyE(y
16、x)=β0+β1xy●.4u{4y3.●}u3y●.2u2{}u1y1●x1x2x3x4x13OLS估计的推导为了推导OLS估计,假定ofE(u
17、X)=E(u)=0和(2.5)Cov(X,u)=E(Xu)=0(2.6)因为(Cov(X,Y)=E(XY)–E(X)E(Y))用可观测变量X和Y以及未知参数和来表示,(2.5)和(2.6)可分别写为(2.7)(2.8)