资源描述:
《面板数据模型与应用张晓彤》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、面板数据模型与应用张晓峒中国数量经济学会常务理事,学术委员会委员南开大学数量经济学专业博士生导师xttfyt@public.tpt.tj.cn,nkeviews@yahoo.com.cn最近新书:1.BadiH.Baltagi,EconometricAnalysisofPanelData,JohnWiley&Sons,2005.2.JeffreyM.Wooldridge,EconometricAnalysisofCrossSectionandPanelData,3.ChengHsiao,AnalysisofPanelData,CambridgeUniv
2、ersityPress,2003.4.ManuelArellano,PanelDataEconometrics(AdvancedTextsinEconometrics),2003.5.EdwardW.Frees,LongitudinalandPanelData:AnalysisandApplicationsintheSocialSciences,2004.6.谢识予朱宏鑫编著,高级计量经济学,2005-57.童光荣,计量经济学,武汉大学出版社2006-3学术会议:1.13thInternationalConferenceonPanelData,Facu
3、ltyofEconomics,&RobinsonCollege,UniversityofCambridge,Cambridge,UK,7-9July20061.面板数据定义paneldata的中译:面板数据、桌面数据、平行数据、纵列数据、时间序列截面数据、混合数据(pooldata)、固定调查对象数据。面板数据定义(1)面板数据定义为相同截面上的个体在不同时点的重复观测数据。(2)称为纵向变量序列(个体)的多次测量。29面板数据从横截面(crosssection)看,是由若干个体(entity,unit,individual)在某一时点构成的截面观测值
4、,从纵剖面(longitudinalsection)看每个个体都是一个时间序列。图1N=7,T=50的面板数据示意图面板数据用双下标变量表示。例如yit,i=1,2,…,N;t=1,2,…,Ti对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。若固定t不变,yi.,(i=1,2,…,N)是横截面上的N个随机变量;若固定i不变,y.t,(t=1,2,…,T)是纵剖面上的一个时间序列(个体)。这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。29案例1(file:panel02):199
5、6-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据见file:panel02。数据是7年的,每一年都有15个数据,共105组观测值。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。横截面数据散点图的表现与观测值顺序有关。图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。图215个省级地区的人均消费序列(纵剖面)图315个省级地区的人均收入序列(file:5panel02)图47个时
6、点人均消费横截面数据(含15个地区)图57个时点人均收入横截面数据(含15个地区)(每条连线数据表示同一年度15个地区的消费值)(每条连线数据表示同一年度15个地区的收入值)29用CP表示消费,IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。图6人均消费对收入的面板数据散点图(15个时间序列叠加)图7人均消费对收入的面板数据散点图(7个截面叠加)图8北京和内蒙古
7、1996-2002年消费对收入散点图图91996和2002年15个地区的消费对收入散点图292.面板数据模型分类用面板数据建立的模型通常有3种,即混合回归模型、固定效应回归模型和随机效应回归模型。2.1混合回归模型(Pooledmodel)。如果一个面板数据模型定义为,yit=a+Xit'b+eit,i=1,2,…,N;t=1,2,…,T(1)其中yit为被回归变量(标量),a表示截距项,Xit为k´1阶回归变量列向量(包括k个回归量),b为k´1阶回归系数列向量,eit为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截
8、面,回归系数a和b都相同。如果模型是正确设定的,解释变量与误差项不相关,即Cov(Xit,ei