资源描述:
《我国教育投入对经济增长贡献率的实证研究.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
我国教育投入对经济增长贡献率的实证研究——基于面板分位数回归模型湖南大学吴之亮、游万海、刘炼摘要本文基于我国各省区市1997-2008年的样本数据,对教育投入的产出弹性进行了实证分析。为了防止数据序列之间的伪回归,先对数据序列进行了单位根检验,在变量序列同阶单整的条件下,进行了协整检验,检验可知变量序列之间存在长期稳定的均衡关系。随后,利用新近流行的面板分位数回归模型估计了各区域教育投入在各分位点的产出弹性,并进行了分析,所得主要结论是:教育投入对经济增长具有显著地正向作用;随着分位点水平(即经济水平)由低到高,教育投入的产出弹性越来越大;不同区域中经济水平的条件分布特征有所不同;在各分位点水平上,教育投入的产出弹性在东、中部区域较为接近且明显大于西部区域。最后,针对所得结论提出了一些政策建议并指出了文章改进方向。关键词:教育投入;经济增长;分位数回归 一引言(一)研究的背景及意义经济增长理论一直以来都是经济学研究的一个重要方面。很多发展中国家工业化进程中出现了贫困陷阱,江晓薇等认为我国要防止这种现象发生,需要转变经济增长方式,由总量拉动增长转向提高生产素质推动的增长,充分发挥人力资本的效应使之成为未来经济增长的重要因素。大量研究成果表明,经济增长离不开人力资源的有效开发,而教育投入对于人力资本的形成具有基础性意义[1][2]。高素质的人力资本通过与土地、资本和科学技术的有机结合和合理配置,使得对经济增长产生推动作用。从柯布一道格拉斯生产函数的方法研究到罗默一卢卡斯模型的建立都充分说明了教育投入对经济增长的贡献。而美国经济学家、诺贝尔经济学奖获得者刘易斯则在其著的《经济增长理论》中直接将“教育所引起的知识的增长”归结为经济增长的三个原因之一。众所周知,我国是世界第一人口大国,在自然资源、物质资本、劳动力资源三者中,我国劳动力资源丰富但自然资源相对匮乏。充分利用劳动力资源是促进经济增长的最有效手段,也是我国经济可持续发展的必要条件。未来的竞争是人才的竞争,如何将我国丰富的劳动力资源转化为人力资本,提高劳动者的素质,对我国的经济发展具有十分重要的意义。我国政府高度重视教育的发展。《国家中长期教育改革和发展规划纲要(2010—2020年)》针对我国教育存在的主要矛盾和突出问题,提出了“优先发展、育人为本、改革创新、促进公平、提高质量”的20字工作方针;提出了到2020年“基本实现教育现代化,基本形成学习型社会,进入人力资源强国行列”的战略目标。温总理在政府工作报告中多次强调了教育的重要性,他指出“教育、科技和人才,是国家强盛、民族振兴的基石,也是综合国力的核心。强国必须强教。只有一流的教育,才能培养一流人才,建设一流国家”,提出要全面实施科教兴国战略和人才强国战略,要抓紧启动实施《国家中长期教育改革和发展规划纲要(2010-2020)》。教育是关系到我们国家民族振兴和社会进步最重要的一块基石,寄托着亿万家庭对美好生活的期盼,关系着民族素质和国家未来,从某种意义上说,教育已成为最大的民生问题。在知识和信息社会高速发展的今天,教育是一切科学研究、技术创新的基础;学校、教育已经成为决定国家经济竞争力的重要因素。(二)国内外的研究现状国内外学者对教育投入与经济增长的关系进行了大量实证研究,研究方法大体归纳如下:①运用总量生产函数模型及其扩展模型或者改造后的菲德两部门模型等测算教育投入对经济增长的贡献度:代表性文献有Denison(1962)[3],蔡增正(1999)[4]等。②运用时序分析方法中的协整理论、误差修正模型等进行分析:张锦(2008)运用Johansen协整检验和Granger因果检验方法,结合1994-2003年的样本数据,实证分析了我国教育投入与经济增长的关系,分析结果表明:尽管教育投入与经济增长有各自的变动规律,短期内可能不一致,但存在着长期稳定的均衡关系[5]。周英章、金戈(2001)实证分析结果 表明我国教育投入与实际经济增长长期内也存在着稳定地协同互动关系,并测算出教育投入的经济增长弹性为0.979,表明通过增加教育投资从而实现经济总量的快速增长在我国具有政策可行性和有效性[6]。③运用面板数据模型,进行分区域对比研究:姜明惠(2006)运用面板数据模型对我国东、中、西部1997-2003年教育投入对经济增长的作用进行比较分析,发现三个区域教育投入对经济增长作用的大小存在显著差异。东部地区教育投入成为带动经济发展的重要因素,中部地区次之,西部地区教育投入则没能很好地带动经济发展[7]。④其他方法:吴学品(2007)运用非参数回归模型对我国教育投入和经济增长的动态关系进行了实证分析[8]。于凌云(2008)在Lucas(1988)等的基础上,将教育投入主体分为非政府教育投入和政府教育投入两类,分析了均衡条件下两类教育投入比与长期经济增长的关系[9]。(三)问题的提出已有研究因角度、测算方法和时间跨度的不同,所测算出的贡献率大小存在着一定差异,但却可以发现,无论是理论分析还是实证分析,都肯定了教育投入在经济增长中的贡献。这些文献为本文的研究提供了诸多的参考和启发,但相关主题的研究仍存在进一步拓展的空间。众所周知,我国各不同区域的教育和经济发展状况并不相同,现在我们想知道在不同的经济水平上,教育投入对经济增长的贡献率是否存在不同,其变化规律又如何,已有研究则很少涉及。分位数回归通过对因变量分布的不同部分进行研究,能够挖掘出更多有用的信息,更加真实、准确地反映自变量与因变量之间的关系,可以很好地解决这一问题。基于此,本文试图基于省际面板数据运用分位数回归方法进行一些尝试。为了获得更多的信息,本文对我国整体和东中西部三个区域分别进行了面板分位数的回归,并分析了同一区域不同分位点水平下教育投入对经济增长贡献率的变化规律,以及相同分位点水平下不同区域间贡献率的差别情况。二分位数回归模型介绍(一)分位数回归模型的优势分位数回归(QuantileRegression)提供了因变量的条件分位数和自变量之间线性关系的估计方法,最早由Koenker和Bassett于1978年提出[10]。相比最小二乘估计,分位数回归模型有其独特的优势[11]:(1)分位数模型特别适合具有异方差性的模型;(2)能给出条件分布的大体特征,对条件分布的刻画更加的细致。(3)分位数回归对分布假设的要求不高,在扰动项非正态的情形下,分位数估计量相比最小二乘估计量更为有效;(4)分位数回归通过使加权误差绝对值之和最小求得参数的估计,因此估计量不易受到异常值的影响,估计更加稳健。(二)分位数回归的基本思想和系数估计[11]假设随机变量Y的分布函数为(1) Y的分位数定义为满足的最小y值,即,(2)可由如下的经验分布函数替代:(3)式中,为Y的N个样本观测值。回归分析的基本思想是使拟合值尽可能地接近观察值,分位数回归是使加权误差绝对值之和最小。的分位数可以由最小化关于的目标函数得到,即(4)式中,函数表示取函数最小值时的取值,称为检查函数(checkfunction),依据取值符号进行非对称的加权;是指示函数,是条件关系式,当为真时,;当为假时,。式(4)中的条件关系式为,当时,,否则取值为0。通过对此最小化问题进行考察便可知的第个分位点值是上述优化问题的解。现假设因变量Y的条件分位数由个解释变量组成的矩阵线性表示:(5)式中,为解释变量向量,是分位数下的系数向量。当在(0,1)上变动时,通过求解下式就可以得到分位数回归的参数估计:(6)我们即可根据在不同分位点估计的不同参数,了解教育投入在不同经济水平时对经济增长的影响效应及其变化规律状况,并以此来分析其经济含义。 三变量定义及数据处理本文采用1997-2008年的全国31省区市的面板数据进行分析。为保证数据的可得性和准确性,本文中教育投入用预算内教育经费(不包括教育费附加)表示,经济增长用国内生产总值(GDP)来反映。为了使不同时点和地区的数据具有可比性,消除价格因素的影响,本文以1997年为基期,对两个变量分别进行了折算。考虑到人口数量的变化,用相对量数据进行分析将更有意义,因此本文用各年总量数据除以年末人口数求出了人均值。为了避免数据的剧烈波动,消除可能存在的异方差,本文对可比人均数据取对数,新变量分别命名为lnVEDU、lnVGDP。所用数据来源于《中国统计年鉴》和《中国教育统计年鉴》(2001-2003年数据为第一次经济普查后修订的数据;2005-2008年数据为第二次经济普查后修订的数据)。四实证分析为了防止数据序列之间的伪回归,需先对数据序列进行平稳性检验——单位根检验。该方法是先检验数据序列的平稳性,若数据序列非平稳,再观察通过差分运算或者其他变换,能否得到具有平稳性的序列,即判断是否为单整序列。当解释变量和因变量都是同阶单整序列时,再进行协整检验,依此来确定变量之间是否存在长期稳定的均衡关系。(一)PanelData的单位根检验面板数据单位根的检验方法分为两类,一类为相同根情形下的单位根检验包括LLC检验、Breitung检验和Hadri检验;另一类为不同根情形下的单位根检验包括Im-Pesaran–Shin检验、Fisher-ADF检验和Fisher-PP检验。为了克服选择一种方法进行检验所带来的偏差,本文选择Breitung检验、Im-Pesaran–Shin检验、ADF-Fisher检验和PP-Fisher检验四种方法对各变量序列进行单位根检验,检验结果见表1。表1两变量序列的单位根检验结果序列统计量BreitungIm-Pesaran-SkinFisher-ADFFisher-PPlnVGDP8.14(1.0000)3.44(0.9997)35.44(0.9973)47.40(0.9146)lnVEDU0.38(0.6469)-0.70(0.2413)64.93(0.3750)71.69(0.1873)△lnVGDP-3.57(0.0002)*-4.40(0.0000)*129.57(0.0000)*176.64(0.0000)*△lnVEDUNA-9.57(0.0000)*197.26(0.0000)*243.22(0.0000)*注:()内为P值。加“*”表示在5%的显著性水平下拒绝原假设而接受备择假设。根据面板数据时序图,序列lnVGDP、lnVEDU、△lnVGDP均选择含截距项和时间趋势项,序列△lnVEDU选择含截距项不含时间趋势项。综合分析表1四个统计量结果可知,lnVGDP和lnVEDU均存在单位根,但两个变量的一阶差分均拒绝了“存在单位根”的原假设,因此这些变量都是一阶单整的。下面再考察两个变量之间的协整关系。(二)PanelData的协整检验 面板数据的协整检验方法可以分为两大类,一类是建立在E-G二步法检验基础上的面板协整检验,具体方法主要有Pedroni检验和Kao检验;另一类是建立在Johansen协整检验基础上的面板协整检验。Pedroni检验所构造的七个统计量在样本量并不大时,Panelv-Statistic、Grouprho-Statistic检验效果最差,PanelADF-Statistic、GroupADF-Statistic检验效果最好。因此本文选用PanelADF-Statistic、GroupADF-Statistic两个统计量进行检验。为了得到可靠的结论,本文又用另外两种方法进行了协整检验。检验结果见表2、表3。表2Kao检验和Pedroni检验结果(滞后阶数由SIC准则确定)检验方法统计量名统计量值(P值)Kao检验ADF-6.89(0.0000)*Pedroni检验PanelADF-Statistic-1.58(0.0575)GroupADF-Statistic-2.12(0.0170)*注:加“*”表示在5%的显著性水平下拒绝原假设,原假设为不存在协整关系,表3Johansen面板协整检验结果(选择序列有确定性趋势而协整方程只有截距的情况)原假设Fisher联合迹统计量(P值)Fisher联合-max统计量(P值)0个协整向量210.0(0.0000)*156.6(0.0000)*至多1个协整向量171.2(0.0000)*171.2(0.0000)*注:加“*”表示在5%的显著性水平下拒绝原假设而接受备择假设。从表2和表3的检验结果可以看出,我国31个省市的教育投入和经济增长的面板数据之间存在协整关系(本文以下分析均是建立在两组数据序列存在协整关系的基础上)。(三)实证结果及分析本文侧重于考察条件分布的不同位置教育投入对经济增长贡献率的变化规律,以及其在不同区域间的差异情况,因此所选模型不宜过于复杂,本文选用线性模型进行回归分析。对于面板分位数回归模型的估计,本文采用R统计软件,在quantreg软件包下软件R和程序包(quantreg)可以从R的官方网站:http://lib.stat.cmu.edu/R/CRAN/免费下载。,采用自举法(Bootstrap)进行分位数回归的计算[12][13]。在这里我们选择5个具有代表性的分位点,即0.1,0.25,0.5,0.75,0.9。在假设检验与建立置信区间时,估计变异数的bootstrap抽样次数设定为2000。各分位点估计的回归系数反映的是不同分位水平下教育投入对经济增长的贡献率大小。为了进行比较分析,本文亦采用面板数据的常规方法(OLS)运用Eviews6.0进行了估计,选择的是个体固定影响的变截距模型,OLS估计的回归系数反应的是一种平均效应。估计结果见下表:表4教育投入的产出弹性产出弹性Quant10Quant25Quant50Quant75Quant90OLS 全国0.5986(7.39)*0.6221(11.27)*0.6407(17.31)*0.6686(20.49)*0.6831(11.51)*0.6207(79.10)*东部0.5900(5.58)*0.6182(8.46)*0.6536(12.13)*0.6769(18.49)*0.6776(13.91)*0.6726(48.06)*中部0.6051(8.65)*0.6233(11.21)*0.6375(13.08)*0.6546(11.26)*0.6741(9.46)*0.6393(48.53)*西部0.5497(17.75)*0.5537(21.36)*0.5637(19.21)*0.5684(19.77)*0.5935(11.77)*0.5765(48.32)*注:括号内为t统计量;*表示在0.05的显著性水平下拒绝原假设。图:各区域产出弹性随分位点变化的趋势上表给出了全国及东、中、西部教育投入的产出弹性的估计结果。基于全国及东、中、西部的面板数据OLS估计的平均产出弹性分别为0.62、0.67、0.64、0.58,并且均显著,各分位点水平上的估计系数都大于0.54且显著。这表明教育投入对我国经济增长具有显著地正向作用。无论是全国还是东、中、西部区域,教育投入的产出弹性都随着分位点水平的提高而越来越大。随着分位点水平从0.1提高到0.9,教育投入的产出弹性全国从0.60增大到0.68,东部区域从0.59增大到0.68,中部区域从0.61增大到0.67,西部区域从0.55增大到0.59。即在0.1分位点时,教育投入每增加1%,国内生产总值(GDP)在全国和东、中、西部将分别增加0.60%、0.59%、0.61%、0.55%;而在0.9分位点时,教育投入每增加1%,GDP将依次增加0.68%、0.68%、0.67%、0.59%。其原因可能是经济水平越高,相应地基础配套设施越完善,人力资本储备也更丰富,教育投入可以更快地转化为先进技术、发明等,通过与劳动、资源等结合,使这些要素得到更有效率的发挥,因而对经济增长的促进作用也就越大。就全国而言,在0.1分位点的产出弹性系数 小于OLS估计的均值弹性,而在0.25、0.5、0.75和0.9分位点的产出弹性系数均大于其均值弹性。东部区域在0.1、0.25和0.5分位点的产出弹性系数均小于其均值弹性,在0.75和0.9分位点的产出弹性系数均大于其均值弹性。中部区域与东部类似。西部区域在0.1、0.25、0.5和0.75分位点的产出弹性系数均小于其均值弹性,在0.9分位点则大于其均值弹性。这些比较结果表明不同区域中经济水平的条件分布特征有所不同。值得注意的是,在各分位点水平上,西部区域教育投入的产出弹性均小于0.6,中部区域均大于0.6,东部区域除0.1分位点外也均大于0.6,通过比较各个分位点水平上三大经济区域教育投入的产出弹性,可知,教育投入的产出弹性在东、中部区域较为接近且明显大于西部区域。这使与我国实际情况相符的,相对于西部区域,东、中部区域经济发展水平高并且集中了大量的具有高等教育程度的人力资本,对科学知识和先进技术的吸收能力较强,因而能更有效地促进经济快速发展。五主要结论及政策涵义本文基于我国31个省区市1997-2008年的样本数据,利用面板分位数回归模型估计了各区域教育投入在各分位点的产出弹性,由此来揭示产出弹性在各区域的分布特征和变化规律,以及在各分位点的区域差异。基于实证分析的结果,得出了如下主要结论:(1)不管基于全国还是东、中、西部区域的估计都表明教育投入对经济增长具有显著地正向作用。(2)随着分位点水平(即经济水平)由低到高,教育投入的产出弹性越来越大。(3)不同区域中经济水平的条件分布特征有所不同。(4)在各分位点水平上,教育投入的产出弹性在东、中部区域较为接近且明显大于西部区域。结论的政策涵义是:(1)由分析结果可知教育投入对经济增长具有显著地正向作用,而且随着经济水平的提高,教育投入的产出弹性越来越大,因此应加大教育投入力度。而我国2010年度国家财政性教育经费占GDP的比例仍没有实现4%的目标,教育经费投入总量仍然偏少,单靠国家投入必然会力不从心,可考虑建立多元化的教育投入体制,鼓励多方位的社会资源投入办学,全面提升我国教育的投入水平。(2)缩小区域间差异,注重协调发展。我国西部区域经济不发达,其教育投入培养的人才一大部分转移到东、中部区域,人力资本流失严重,教育投入对经济增长的贡献率不及东、中区域。因此,在增加教育投入的同时,政府更要采取有效措施吸引和留住高素质人才,只有这样才能实现经济的持续快速发展及其区域的协调发展。需要指出的是,虽然教育投入对经济增长的贡献率不言而喻,但本文只分析了教育投入这个因素对经济增长的影响,而忽略了其他因素,使得结论的准确性容易遭到质疑。在后续研究中,通过对数据长期性和影响因素全面性的进一步考察,可能会得出更为准确的结论。参考文献: [1]Romer,PaulM.IncreasingReturnsandlong-RunGrowth[J].JournalofPoliticalEconomy,1986,94(5):2-37.[2]Lucas,RobertE.Jr.OntheMechanicsofEconomicDevelopment[J].JournalofMonetaryEconomics,1988,(22):3-42.[3]EdwardFDenison.HowtoRaisetheHigh-EmploymentGrowthRatebyOnePercentagePoint[J].AmericanEconomicReview,1962,52(2):67-75.[4]蔡增正.教育对于经济增长贡献的计量分析——科教兴国战略的实证依据[J].经济研究,1999,(2):39-48.[5]张锦.教育投入与我国经济增长关系的实证研究[J].石家庄铁道学院学报(社会科学版),2008,2(2):28-31.[6]周英章,金戈.中国教育投资的经济增长效应实证分析[J].教育与经济,2001,(3):41-44.[7]姜明慧.我国东、中、西部教育投入和经济增长的PanelData模型分析[J].经济与科技,2006,(07):31-32.[8]吴学品.我国教育投入对经济增长影响的动态关系研究[J].统计与决策,2007,(21):118-120.[9]于凌云.教育投入比与地区经济增长差异[J].经济研究,2008,(10):131-143.[10]Koenker,Roger,GilbertBassett,Jr..RegressionQuantiles[J].Ecometrica,1978,46(1):33-50.[11]高铁梅.计量经济分析方法与建模——EViews应用及实例[M].第二版.北京:清华大学出版社,2009.118-126.[12]李育安.分位数回归及应用简介[J].统计与信息论坛,2006,21(3):35-38.[13]汤银才.R语言与统计分析[M].第一版.北京:高等教育出版社,2008. 附录R软件程序脚本:rq.fit.panel<-function(X,y,s,w=c(.1,.25,.5,.25,.1),taus=c(0.1,0.25,0.5,0.75,0.9),lambda=1){#prototypefunctionforpaneldatafittingofQRmodels#thematrixXisassumedtocontainanintercept#thevectorsisastrataindicatorassumed(sofar)tobeaone-waylayout#NB:#1.Thevalueoftheshrinkageparameterlambdaisanopenresearchproblemin#thesimplesthomogneoussettingsitshouldbetheratioofthescaleparameters#ofthefixedeffectsandtheidiocyncraticerrors#2.Onreturnthecoefficientvectorhasm*p+nelementswheremisthenumber#quantilesbeingestimated,pisthenumberofcolumsofX,andnisthe#numberofdistinctvaluesofs.Thefirstm*pcoefficientsarethe#slopeestimates,andthelastnarethe"fixedeffects"#3.Likeallshrinkage(regularization)estimators,asymptoticinferenceissomewhat#problematic...sothebootstrapisthenaturalfirstresort.require(SparseM)require(quantreg)K<-length(w)if(K!=length(taus))stop("lengthofwandtausmustmatch")X<-as.matrix(X)p<-ncol(X)n<-length(levels(as.factor(s)))N<-length(y)if(N!=length(s)||N!=nrow(X))stop("dimensionsofy,X,smustmatch")Z<-as.matrix.csr(model.matrix(~as.factor(s)-1))Fidelity<-cbind(as(w,"matrix.diag.csr")%x%X,w%x%Z)Penalty<-cbind(as.matrix.csr(0,n,K*p),lambda*as(n,"matrix.diag.csr"))D<-rbind(Fidelity,Penalty)y<-c(w%x%y,rep(0,n))a<-c((w*(1-taus))%x%(t(X)%*%rep(1,N)),sum(w*(1-taus))*(t(Z)%*%rep(1,N))+lambda*rep(1/2,n))rq.fit.sfn(D,y,rhs=a)} R统计软件操作程序:library(“quantreg”)source(“rq.fit.panel”)m<-12n<-8s<-rep(1:n,rep(m,n))data<-read.csv("zhongbu.csv")x<-data$LNVEDUX<-cbind(1,x)y<-data$LNVGDPfit<-rq.fit.panel(X,y,s)fitn1=length(y)b=2000#Numberofbootstrapsamplesncoef=5*ncol(X)+nboot_bhat=matrix(NA,b,ncoef)block_length=8#代表块状长度num_blocks=n1/block_length#n/block_lengthIndices=seq(1:n1)#Alloftheindicesfrom1tonIndices=matrix(Indices,block_length,num_blocks)for(iin1:b){#Numberofbootstrapsamplesrandblock=sample(seq(1:num_blocks),num_blocks,replace=TRUE)#ChoosewhichblockstouseInd_sim=Indices[,randblock]#FindwhichdataareineachblockInd_sim=c(Ind_sim)Xsim=X[Ind_sim,1:dim(X)[2]]#ConstructthexdataYsim=y[Ind_sim]#Constructtheydataboot_bhat[i,]=rq.fit.panel(Xsim,Ysim,s)$coef}bhat=colMeans(boot_bhat)cov=cov(boot_bhat)serr=sqrt(diag(cov))p<-length(bhat)rdf<-n1-pvnames<-dimnames(x)[[2]]coef<-array(bhat,c(p,4))dimnames(coef)<-list(vnames,c("Value","Std.Error","tvalue","Pr(>|t|)"))coef[,2]<-serrcoef[,3]<-coef[,1]/coef[,2]coef[,4]<-if(rdf>0)2*(1-pt(abs(coef[,3]),rdf))coef