(区域)基于面板数据的辽宁省城市发展水平聚类研究

(区域)基于面板数据的辽宁省城市发展水平聚类研究

ID:34227158

大小:159.50 KB

页数:5页

时间:2019-03-04

(区域)基于面板数据的辽宁省城市发展水平聚类研究_第1页
(区域)基于面板数据的辽宁省城市发展水平聚类研究_第2页
(区域)基于面板数据的辽宁省城市发展水平聚类研究_第3页
(区域)基于面板数据的辽宁省城市发展水平聚类研究_第4页
(区域)基于面板数据的辽宁省城市发展水平聚类研究_第5页
资源描述:

《(区域)基于面板数据的辽宁省城市发展水平聚类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于面板数据的辽宁省城市发展水平聚类研究城市发展水平综合反映一个地区经济、文化、科技等方面的发展状况,随着城市数量不断增加,城市规模不断扩大,不同城市之间发展水平出现差异。全面分析与比较城市之间的差异,对促进城市全面、健康与可持续发展具有极其重要的意义。城市发展水平不仅包含固定时点城市发展状况,还包含特定时期内城市发展状况。因此,研究城市发展水平差异,不但要考察各项指标的绝对水平信息,更要考察各项指标的发展速度,它代表城市发展潜力。面板数据是不同时点截面数据的结合体,既包含固定时点指标的信息,也包含

2、一段时期内指标的动态信息,因此,选择面板数据研究城市发展水平差异更合理。本文选取代表辽宁省城市发展水平的11项指标,选取多个指标在覆盖大部分信息的同时也会导致信息重叠问题,本文试图对指标“降维”加以解决。笔者用加权平均法代替简单平均法处理面板数据,对加权后的数据做主成分分析。在对指标“降维”后,用面板数据聚类分析法对辽宁省14个地级市分类,得到的聚类结果可为进一步研究城市发展水平奠定基础。一、面板数据聚类分析理论面板数据聚类分析与传统聚类分析最大不同之处在于样本距离的定义。t=i期截面数据的样本距离

3、可用传统的欧式距离(1)式表示:xik,xjk分别表示样本i和样本j在第k个指标上的取值,i,j=1,…,M;k=1,…,N。该距离公式包含固定时期两样本各指标绝对水平差异,对于面板数据,该距离公式不再适用。(2)式是“全时绝对距离”,反映整个时期内两样本各个指标绝对水平的差异。(3)式是“全时增长速度距离”,反映整个时期内两样本各指标变化速度的差异,即样本动态的差异。面板数据的样本距离是“全时绝对距离”和“全时增长速度距离”的加权和:(4)式不但度量了整个时期内样本各指标间绝对水平差异,还度量了样

4、本各指标变化差异。全面反映出面板数据样本间差异。但(3)式存在一个缺陷,它只度量两样本各指标变化率大小差异,未考虑两样本各指标变化方向差异,即忽略的符号对距离的影响。对此,本文根据xikt(或Xjkt)在相邻两时期的取值数据,的符号做修改,使修改后的数据满足只要的符号就为正,否则为负。基于此重新计算(4)式距离。此外,(4)式需满足α+β=1,α、β取值可以结合研究的实际问题主观给定。若侧重考查不同样本的绝对水平对分类结果的影响,则α取值应大一些;若侧重考查两样本发展速度对分类结果的影响,则β取值应

5、大一些。本文旨在按照发展水平对城市分类,各项指标绝对水平差异和发展速度差异对城市发展水平差异的贡献应同等对待,故本文实证分析中将两个系数均设为1/2。本文采用系统聚类法,类间距离用最短距离法计算。二、实证分析1.指标选取。基于目前关于城市发展水平的研究,可以得出:城市发展水平主要受经济发展水平、基础设施建设水平以及科技发展水平这三方面的影响。经济发展水平是城市发展水平的重要标志,它反映城市发展的现状以及未来发展的潜力;基础设施建设水平是城市经济发展的载体,也是城市参与区域竞争的基本前提和保证;科技发

6、展水平是城市经济发展和生产率提高的基本驱动力和源泉。兼顾数据可获得性,本文选取人均GDP等11项指标(见表1)。作为科技发展的基础,高等教育的地位不容忽视,故本文选取两项反映高等教育水平的指标代替科技水平指标。为消除城市规模的影响,本文所选指标大多是人均指标。指标样本区间是2008~2010年,其中2008~2009年人均可支配收入数据来源于《辽宁统计年鉴2010》,2010年人均可支配收入来源于各市统计公报,其它指标数据来源于《中经网统计数据库城市年度库》。2.指标“降维”处理。为消除以上11个指

7、标的信息重叠,本文采用主成分分析法进行指标“降维”,在主成分分析之前,先将原始数据标准化以消除量纲的影响,然后通过加权平均法,将面板数据转换为截面数据。具体过程如下:是第i个样本的第k个指标在所有时期的均值是第i个样本的第k个指标所有时期值的方差,以作为权重,对原来数据求加权平均,得到变量新值为至此,初始的面板数据转化为了截面数据。该过程用SAS9.2编程完成。对新生成的截面数据做主成分分析,结果显示,前3个主成分提取了原始变量约85.008%的信息,故选取3个主成分是合适的。表2是因子载荷矩阵,主

8、成分y1在x1x2、x3、x8、x9、x10、x11上的因子载荷值比较大,都超过0.8,故主成分y1是人均GDP、人均固定资产总额、人均社会消费品零售额、每万人拥有公共汽车数量、人均公共图书馆藏书、高等学校专任教师数和高等学校在校生人数这几个指标的综合反映,这些指标从经济、文化和生活便利程度三方面反映了城市居民的生活水平,因此,将y1命名为居民生活水平因子。主成分y2在x5上的因子载荷值比较大,x5表示第二、三产业产值占GDP的比重,它是衡量产业结构优劣的重要指标,故

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。