欢迎来到天天文库
浏览记录
ID:5942038
大小:29.50 KB
页数:8页
时间:2017-12-29
《基于系统聚类江西旅游发展探究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于系统聚类江西旅游发展探究 [摘要]旅游业的发展对于江西省实现“中部崛起”具有重大意义,既能充分利用江西省各种特色丰富的旅游资源,促进江西省经济健康、可持续发展,又能转移江西省剩余劳动力、实现产业结构优化升级。应用系统聚类法采用SPSS18.0软件测试版对江西省11个地级市的旅游基本情况进行分类,提出萍乡、宜春、新余及抚州应在基础设施建设、旅游线图设计、旅游产品开发、信息共享方面协同考虑,景德镇、上饶、鹰潭以及南昌应结合自然生态资源禀赋,大力发展绿色生态家园旅游业,赣州、吉安应借鉴九江市先进经验,基础设施的建设空间布局等方面加强协作。
2、[关键词]系统聚类法;江西省;旅游业;资源共享一、系统聚类法1.系统聚类法简介聚类分析(ClusterAnalysis)是根据事物本身的特性来定量研究分类问题的一种多元统计分析方法。其基本思想是同一类中的个体有较大的相似性,不同类中的个体差异较大,于是根据一批样品的多个测量指标,找出能够度量样品(或变量)之间相似度的统计量,并以此为依据,采用某种聚类法(Method),将所有的样品(或变量)分别聚合到不同的类中。8聚类分析使用的方法大致分为两类:系统聚类法(HierarchicalClustering)和非系统聚类法(Non-hierar
3、chicalClustering),前者用于所给数据所分类别数目未知的情形,后者用于所给数据所分类别数目已知的情形。本文选择系统聚类法。在实际应用中,根据分类对象的不同有样品(Case)聚类(又称Q型聚类)和变量(Variable)聚类(或称R型聚类)之分。前者对样品(或事件)进行分类,后者以变量为单位进行聚类。本文选择前者进行聚类。2.采用SPSS进行系统聚类(HierarchicalCluster)的基本步骤目前进行聚类分析的软件很多,SPSS、SAS、R、S-plus、Matlab等,本文采用SPSS18.0测试版进行聚类分析,其基
4、本步骤如下:第一步,选择分析变量,生成变量矩阵,,,、分别为样本数和变量数。第二步,数据标准化。本文采用标准化变换来消除各变量间的量纲。具体做法如下,通过标准化公式(,)(1)将原始数据变换为,其中,为第个变量的样本标准差。经过这样标准化变换后的数据,每个变量的样本均值为0,标准差为1,与变量的量纲无关。8第三步,选择距离或相似系数的计算公式,生成距离矩阵或相似矩阵作为相应的聚类统计量,距离主要用于样品分类,相似系数主要用于变量的分类。本文是对样品进行分类,所以选择欧氏距离平方作为聚类统计量,其矩阵表达形式为:(2)其中,为变量个数,为样
5、品数目。第四步,选择聚类方法,将距离最近的两个样品合成一类。本文选择离差平方和法(WARD法)进行聚类,WARD法必须采用欧式距离计算。当和合并为后,与其他类的距离递推公式为:(3)其中,、、和分别为、、和各类中样品的数目。第五步,重复上述步骤,直至所有样品归为一类。第六步,输出聚类结果和系统聚类图,并根据实际情况、分类准则等得出最终分类结果。二、系统聚类在江西省各地市旅游中的应用1.数据的收集8数据的收集一般分为一手资料和二手资料两大类,一手资料是指研究者本身为了其研究目的经过自身搜集整理或直接经验所得,一手资料是经过研究者实地考察、亲
6、身走访搜集的实证研究资料;二手资料是指某些特定研究组织受企业、政府等机构委托,对于一手资料进行调查统计的资料。二手资料包括各地年鉴、企业统计报表、产业统计便览、地图等。本文考虑二手资料的可得性以及年鉴的可靠性,选择《江西省统计年鉴》中的数据,选取2007—2009年(整理)江西省各地市旅游多种指标作为本文分析数据,经过多种变量组合聚类分析的结果比较,最终采用国内游客数(人次),外国游客数(人次),香港游客数(人次),澳门游客数(人次),台湾游客数(人次),旅游收汇(万美元),星级饭店数目这7个指标进行聚类,得到11×7矩阵:该矩阵的行向量
7、的分量分别表示江西省各地级市,具体为南昌市,景德镇市,萍乡市,九江市,新余市,鹰潭市,赣州市,吉安市,宜春市,抚州市,上饶市。2.系统聚类分析在SPSS软件中实现聚类过程时,系统聚类共输入11个样本,有效样本为11个,且没有缺失值的存在,所得到聚类统计量用如下距离矩阵表示:与原始矩阵的行向量相对应,元素表示南昌与南昌的距离,表示南昌与景德镇的距离,表示南昌与萍乡的距离,以此类推。由距离矩阵,我们发现萍乡和宜春的相似性最大(即距离最小),其次是宜春和抚州,接着是抚州和新余,以此类推,新余和九江之间的差距最大。图1江西各地区谱系聚类图8值得注
8、意的是,根据距离矩阵只是将11个样本分成10类,随后在新的10类中SPSS将再次根据离差平方和法计算新的类间距离矩阵,并根据将10类分成9类,在此基础上重复前述方法计算聚类统计量,直到将所有样
此文档下载收益归作者所有