欢迎来到天天文库
浏览记录
ID:14416537
大小:150.78 KB
页数:3页
时间:2018-07-28
《无量纲化方法比较》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、SPSS聚类分析中数据无量纲化方法比较SPSS聚类分析中数据无量纲化方法比较ComparisonofUndimensionalizationinSPSSClusterAnalysis韩胜娟HanShengjuan(华东交通大学,江西南昌330013)(SchoolofEconomicsandManagement,EastChinaJiaotongUniversity,JiangxiNanchang330013)摘要:聚类分析方法作为一种多指标综合评价方法,其在分析过程中数据无量纲化处理就是必不可少的。SPSS软件聚类分析菜
2、单提供了四大类指标数据无量纲化处理方法,不同处理方法的特点不同,适用的数据也不尽相同。本文试图对不同的无量纲化处理方法的特点和适用数据进行分析。关键词:SPSS;聚类分析;无量纲化方法中图分类号:O212.4文献标识码:A文章编号:1671-4792-(2008)3-0017-03Abstract:Theclusteranalysisisonemulti-objectivequalitysyntheticevaluationmethod,Undimensionalizationisessentialintheanalysi
3、sprocess.InSPSSclusteranalysismenuprovidfourUndimensionalizationmethods,thedifferentUndimensionalization'scharacteristicisdifferent,thesuitabledataisalsodifferent,thisarticleattemptstocarryonthis.Keywords:SPSS;ClusterAnalysis;Undimensionalization聚类分析是目前广泛使用的一种建立分类
4、的多元统计分距。标准化后将各变量的取值范围限于0~1。析方法。针对复杂的社会经济现象利用聚类分析方法进行综③Maximummagnitudeof1:(3)合分析时,往往需要建立广泛而全面的统计分析指标体系。即每一变量值除以该变量取值的最大值。标准化后使各而各个指标之间由于计量单位和数量级不尽相同,从而使得变量的最大取值为1。各指标间不具有综合性,不能直接进行综合分析,这时就必采用极值化方法对变量数据无量纲化是通过利用变量取须采用某种方法对各指标数值进行无量纲化处理,解决各指值的最大值和最小值将原始数据转换为界于某一特定范围
5、的标数值不可综合性问题。利用SPSS统计分析软件可以很方便数据,从而消除量纲和数量级影响,改变变量在分析中的权的进行聚类分析。另外,SPSS软件聚类分析菜单中提供了下重来解决不同度量的问题。为了说明问题,我们以2004年北面四大类指标无量纲化处理方法。京、天津、上海大中型工业企业的利润总额、总资产贡献率、第一大类:极值化方法。在SPSS中提供了以下三种极流动资产周转次数这三个主要经济效益指标为例,分别以原值化方法。始数据(见表一)和采用(2)式的无量纲化数据进行聚类①Range-1to1:(1)分析,计算三个样本城市的欧式
6、距离平方(见表二)。即每一变量值除以该变量取值的全距。标准化后将各变表一2004年大中型工业企业主要经济指标量的取值范围限于-1~1。②Range0to1:(2)即每一变量值与变量最小值之差除以该变量取值的全资料来源:《中国统计年鉴2005》229科技广场2008.3表二不同样本组合欧式距离平方在无量纲化过程中不能满足这一方面的要求。第三大类:均值化方法,即每一变量值除以该变量的平均值。标准化后各变量的平均值都为1,标准差为原始变量的变异系数。Meanof1:(5)从表中可以看出,利用原始数据分析时,北京与天津的该方法在消
7、除量纲和数量级影响的同时,保留了各变量关系最为密切、最相近,其次是天津与上海,最后是北京与取值差异程度上的信息,差异程度越大的变量对综合分析的上海,说明利润总额这一指标起了主要作用,其权数较大;影响也越大。该无量纲化方法在保留原始变量变异程度信息将原始数据按(2)式无量纲化处理后分析时,天津与上海时,并不是仅取决于原始变量标准差,而是原始变量的变异的关系最为密切,其次是北京与上海,最后是北京与天津。系数,这也就保证了保留变量变异程度信息的同时数据的可由于选取的样本个数较少,标准化后的指标值又界于0~1比性问题。间,这时三个
8、指标的权重近似相同,从而降低了利润总额这第四大类:标准差化方法,即每一变量值除以该变量的一指标的权重,提高了其它两个指标的权重。标准差。无量纲化后各变量的标准差都为1。由于极值化方法在对变量无量纲化过程中仅仅与该变量Standarddeviationof1:(6)的最大值和最小值这两个极端值有关,而与其
此文档下载收益归作者所有