多指标面板大数据的聚类分析报告研究.doc

多指标面板大数据的聚类分析报告研究.doc

ID:55955420

大小:2.11 MB

页数:49页

时间:2020-06-18

多指标面板大数据的聚类分析报告研究.doc_第1页
多指标面板大数据的聚类分析报告研究.doc_第2页
多指标面板大数据的聚类分析报告研究.doc_第3页
多指标面板大数据的聚类分析报告研究.doc_第4页
多指标面板大数据的聚类分析报告研究.doc_第5页
资源描述:

《多指标面板大数据的聚类分析报告研究.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、管理信息系统课程小组作业多指标面板数据的聚类分析研究——以我国15个副省级城市综合竞争力评价为例小组组长:XXXXX小组成员:XXXXXXXXXX完成时间:指导教师:徐德华目录1选题背景与意义42聚类分析与聚类算法52.1聚类分析52.1.1相关概念与定义52.1.2相似度计量模型52.2聚类算法72.2.1传统聚类算法及其比较72.2.2扩展聚类算法133面板数据及其聚类方法153.1面板数据概述153.1.1概念及发展153.1.2面板数据的特点153.1.3面板数据的分析处理方法163.2单指标面板数据的数据

2、形式和聚类分析方法163.3多指标面板数据的数据形式和聚类分析方法173.3.1多指标面板数据的数据形式173.3.2常见的多指标面板数据聚类分析方法174实证研究234.1城市竞争力研究综述234.1.1城市竞争力涵研究综述244.1.2城市竞争力模型研究综述264.1.3城市竞争力评价体系研究综述294.2城市竞争力指标选取304.2.1城市竞争力评价指标选取的原则304.2.2我国15个副省级城市竞争力评价指标体系314.3聚类分析324.3.1基于主成分分析的聚类324.3.2基于指标距离求和的聚类384.

3、3.2基于概率连接函数的聚类404.4结果分析425结论与展望445.1结论…………………………………………………………………………………………………………445.2不足与展望44主要参考文献45附录46附录1……………………………………………………………………………………………………………46附录2……………………………………………………………………………………………………………46附录3……………………………………………………………………………………………………………481选题背景与意义面板数据(PanelDa

4、ta)作为截面数据与时间序列数据的组合数据集,同时体现了空间维度和时间维度的数字特征,克服了时间序列数据多重共线性、数据量不足等困扰,逐渐发展成为现代计量经济学领域统计分析与统计研究的重要方法和工具。运用多元统计方法对面板数据进行聚类分析是统计学的新兴研究领域。聚类分析作为一种数据挖掘手段,已被广泛地应用在许多领域中,包括模式识别、数据分析、图像处理、市场研究、管理评价等。传统的聚类分析对象一般是固定时期的不同个体截面数据,二维数据聚类分析往往不能满足人们分析问题的需要,而且基于单一的固定时期的聚类分析往往抹杀了指

5、标的动态发展趋势及其发展状态,无法预测其未来发展轨迹和所属类别。例如:在城市竞争力聚类分析中,竞争力存在着随时间动态变化过程,仅仅固定在某一年度的截面数据分析就显得有失偏颇,如果根据一个较长时期的面板数据进行聚类分析则显得较为合理。城市竞争力是国近年来正在兴起的一个新课题,目前处于起步研究阶段,还未形成公认的完整体系。经济全球化,知识经济时代的到来,促使我国城市必须进行转型改革,走上新型的发展道路。我国现阶段的城市要从建设城市转向管理和经营城市,就是要重塑城市资源整合和配置资源机制,提高城市对社会资源的吸引力和创造

6、社会财富的能力,从根本上就是提高城市竞争力。城市竞争力评价是典型的综合评价,在不同的评价体系下有不同的指标指标,而且必须考虑时间因素,因此相关的数据就是典型的多指标面板数据。1994年5月,经中央机构编制委员会第6次会议通过,决定将原来的14个计划单列市和、2市正式确定为副省级市(其中,市97年恢复直辖)。将这15个城市定为副省级市,是中央对于区域经济发展的重要决策,加强了省级机构统筹规划和协调的地位和作用,不仅有利于加快这些城市的经济与社会发展,而且有利于更好的发挥这些中心城市的辐射作用。在国家政策层面和经济决策

7、权待遇同等的情况下,经过20年,这15个副省级城市的发展出现了很大差异,城市竞争力也日趋呈现差异化。鉴于此,我们小组决定利用多指标面板数据的聚类方法对此进行探析,一方面介绍面板数据的一些处理思路,另一方面通过聚类寻找15个城市类别之间的差异,以提出相关建议。2聚类分析与聚类算法2.1聚类分析2.1.1相关概念与定义聚类分析(ClusterAnalysis)又称群分析,是根据“物以类聚”的道理,对样品或指标进行分类的一种方法,其目的是将有限个无标注数据划分到有限个离散的组或类中,发现数据隐藏的部结构。聚类分析是数据挖

8、掘的一种重要手段,是一种无监督的模式分类方法,在分类时只依赖对象自身所具有的属性来区分对象之间的相似程度。聚类分析作为一种有效的数据分析方法被广泛应用于数据挖掘、机器学习、图像分割、语音识别、生物信息处理等方面。给定一个对象集合,假设每个对象含有m个特征,在此用向量的方式来表示对象的特征,,聚类分析的过程就是根据对象的特征来分析对象之间的相似程度,并根据某种

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。