多指标面板数据聚类方法及应用一以行业一次能源消费面板数据为例

多指标面板数据聚类方法及应用一以行业一次能源消费面板数据为例

ID:33551729

大小:966.46 KB

页数:8页

时间:2019-02-27

多指标面板数据聚类方法及应用一以行业一次能源消费面板数据为例_第1页
多指标面板数据聚类方法及应用一以行业一次能源消费面板数据为例_第2页
多指标面板数据聚类方法及应用一以行业一次能源消费面板数据为例_第3页
多指标面板数据聚类方法及应用一以行业一次能源消费面板数据为例_第4页
多指标面板数据聚类方法及应用一以行业一次能源消费面板数据为例_第5页
资源描述:

《多指标面板数据聚类方法及应用一以行业一次能源消费面板数据为例》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、DOI:10.13860/j.cnki.sltj.2014.01.0022014年月数理统计与管理第卷余期文章编号:多指标面板数据聚类方法及应用一以行业一次能源消费面板数据为例王双英王群伟曹泽曲阜师范大学管理学院,山东日照南京航空航天大学经济与管理学院,江苏南京苏州大学商学院,江苏苏州安徽建筑工业学院管理学院,安徽合肥摘要综合考虑面板数据多指标中因变量指标特征及其与自变量相标的相关关系,通过定义因变量自协方差及自变量与因变量协方差以构建面板数据相似及相关性测度距离函数引入自組织,在竞争网络算法的基础之上提出指标面板数据聚类的方法以我国年个行业,了多煤炭、天然气、电力消耗量及国际石油价

2、格面板数据进行实际应用验证了新方法聚类结果更为,显著的优点一关键词,自协自组织竞争网络聚类分析次能源消费方差;协方差;;系统广义矩估计;中图分类号:文献标识码:’引言尽管对面板数据聚类分析的研究在二十世纪末才逐渐开始完善,但因面板数据具有同时反映研究对象时间及截面维度信息的优势、数据,相关聚类分析已在图像识别挖掘、经济评价及市场分析等领域广泛应用。收稿日期年月日收到修改稿日期年月日:国家自然科学基金山东省社科基金项目学科技项目基金项目((曲阜师范大王双英等丨多指标面板数据聚类方法及应用李因果认为,面板数据聚类分析应首先解决统计量及聚类方法的问题根据统计量一三类:和聚类方法研究重点的不

3、同,相关文献大体可分为第类文献着重于聚类方法的改进,如和郑兵云分别应用自适应退化方法)和重建函数对面板数据进行聚类分析气徐华锋则通过引入投影寻踪模型对面板数据聚类方法进行改进此类面板数据聚类方法往往选择样本均值如文献⑷、样本方差(如文献等传统统计量,这些数据特征统计量往往因忽视数据的动态特征而遗漏重要的信息。第二类文献侧重于统计量的选择与改进、,主要通过,如李因果和肖泽磊等构建新的统计量对面板数据进行描述或降维‘其中,通过构建样本模的距离函数对面板数据进行降维,肖泽磊则着重选择指标“”距离间的相关系数对面板数据进行降维处理李因果通过定义面板数据的全时绝对量、全””“”“距离“时增长速

4、度、全时变异系数距离及全时综合距离对面板数据进行聚类,得到了广泛的关注第三类文献则对数据特征统计量及聚类方法同时进行改进,如张可引入灰色关联度及灰色聚类对面板数据进行聚类分析虽然此方法在数据年份较少的情况下,对指标聚类具有较好的效果,但是选择灰色关联度与选择相关系数相似,容易造成数据信息的丢失。“”距离全时“”距离“变异系数”虽然文⑴通过定义全时绝对量、增长速度、全时距离“”距较好的考虑了样本数据的总量特征、发展趋势及离散特征,但是,文献在定义全时综合。此外离中,上述三种距离的权重均人为的赋为其合理性有待商榷,数据同样被均值化,“”“”“”因此对全时综合距离的探讨有待完善。其次,绝对

5、量距离、全时增长速度距离、全时“”距离虽然较全面的考虑变异系数了数据特征的相似性,却较少的考虑指标数据的联合分布,即指标的相关性,因而缺乏挖掘数据内在联系的过程同时,计算量异常繁重,操作过程较为复杂也使得方法的实用性有所削弱面板分析中数据挖掘有决定性的意义。而现有的文献在对区域,有效的聚类结果往往对经济及行业指标进行面板数据分析时,往往以区域间的地理相似性或行业间性质相近性进行分类后直接进行面板数据分析一、,如于全辉、李廉水有关我国能源消费与能源效率的研究但是,这种分类方法往往忽略实际问题中样本群体的最大相似性及最大差异性的特点及趋势,有可能在后来的分析中出现类别结果的相近性,从而大

6、大削弱了研究结果的理论及实践意义根据多指标面板数据分析的目的,本文将面板数据分析中的多指标分为因变量指标与自变量指标传统聚类分析是仅考虑因变量指标的特殊情况,通过改进定义的单指标特征统计量协方差多指标面板数据的特点以面板数据因变量自协方差以及因变量与自变量协方差统计量构建聚类分析距离函数,通过分析指标自身及因变量指标和自变量指标之间的统计特征的相似性及相关性对面板数据进行聚类分析,并在此基础之上进行面板数据分析,从而分析研究对象的发展趋势及特点表面板数据二级二维表时间样本‘‘…………44数理统计与管理第卷第期年月面板数据及特征统计构建面板数据可设为,其中,表示样本数,表示样本指标,其

7、中,……示时间维度根据面板数据分析的研究目的以,,,,,,,表,多指标体系可分为因变量指标、与自变量指标其中…’,,,,,,且面板数据可以描述为二维表的形式(见表选择自协方差作为聚类距离函数的原因是,自协方差反映数据的发展趋势以及样本数据的自相关性,朱建平在对单指标面板数据聚类分析中就曾选择其作为聚类距离函数选择一协方差作为聚类距离函数则可以有效的反映因变量与自变量直接的相关关系,是进步进行面板数据分析的基础。首先对样本的个因变量指标分别求自协方差,—五足

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。