关于主成分分析做综合评价的改进.pdf

关于主成分分析做综合评价的改进.pdf

ID:48021743

大小:346.87 KB

页数:5页

时间:2020-01-21

关于主成分分析做综合评价的改进.pdf_第1页
关于主成分分析做综合评价的改进.pdf_第2页
关于主成分分析做综合评价的改进.pdf_第3页
关于主成分分析做综合评价的改进.pdf_第4页
关于主成分分析做综合评价的改进.pdf_第5页
资源描述:

《关于主成分分析做综合评价的改进.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、52数据统计与管理20卷2期2001年文章编号:1002-1566(2001)02-0052-04X关于主成分分析做综合评价的改进叶双峰(黄山林校,安徽245041)摘要:本文结合具体事例,讨论并改进利用主成分分析做综合评价的方法。关健词:主成分分析;综合评价;改进中图分类号:O212.4文献标识码:A一、引言利用主成分分析进行综合评价的基本思路是:首先求出原始P个指标的P个主成分,然后按一定的要求筛选几个主成分,来代替原始指标,再将所选取的主成分用适当的形式进行综合,得到综合评价值,依据它对被评价对象进行比较排序。[1][2]

2、[6]研究并讨论了实际问题,提出了部分改进方法。本文在其基础上提出新改进方法,以希商榷。二、改进原始数据的无量纲化主成分综合评价方法的关健是求主成分,其工具是协方差矩阵。由于协方差矩阵易受指标的量纲和数量级的影响,经常要对原始数据进行标准化处理,标准化使协方差矩阵变成了相关系数矩阵。但在消除量纲与数量级影响的同时,也消除了各指标变异程度上的差异信息。由于原始数据中包含两部分信息:一部分是各指标变异程度的差异信息,由各指标的方差大小来反映;另一部分是各指标间相互影响程度上的相关信息,由相关系数矩阵来体现。标准化使各指标的方差变成1

3、,消除了各指标变异程度上的差异,因此从标准化的数据提取的主成分,实际上只包含了各指标间相互影响这一部分信息,不能准确反映原始数据所包含的全部信息。所以必须改进原始数据的无量纲化方法,均值法方法就是其中较好的一种。设有N个被评价的对象,及P个指标,原始数据为(Xij)n3p,各指标的均值为Xj均值化就是用各指标的均值去除它们相应的原始数据,即Zij=XjiöXj均值化后,数据的协方差矩阵V=(uij)p×p的元素为n1uij=6(zli-zi)(zlj-zj)n-1l=1由上式可知,均值化后各指标的均值为1,可得nn11(xli-

4、xi)(xlj-xj)sijuij=6(zli-1)(zlj-1)=6=n-1l=1n-1l=1xixjxixj式中Sij为原始数据的协方差。特别当i=j时为:X收稿日期:2000-01-15关于主成分分析做综合评价的改进53siisii2uij=2=()xixin12sii=6(xli-xi)nl=1因此,均值化后数据的协方差矩阵的对角元素是各指标的变异系数SiiöXi的平方,它反映各指标变异程度上的差异。均值化前,反映各指标相互影响程度的相关系数rij′的计算公式为:sijrij′=siisjj均值化后的相关系数rij的计算

5、公式为:uijrij′=uiiujj将公式Uij代入可知:sijsiisjjsijrij′=ö==rijxixjxixjsiisjj这就证明了均值化处理不改变各指标间的相关系数,相关系数矩阵的全部信息都在相应的协方差矩阵中得到反映。均值化处理后的协方差矩阵不仅消除了指标量纲与数量级的影响,还能包含原始数据的全部信息,因此在用主成分分析方法做综合评价时,应用均值化方法进行无量纲化处理。三、改进主成分分析的“线性化”传统主成分分析方法存在两个不足之外:一是综合评价的实际结果与评价指标间的相关程度高低成正比,评价指标间相关程度越高,主

6、成分分析的结果越好,当指标间相关性小时,每一个主成分承载的信息量就少,为满足累计方差贡献率达到一定水平(通常为85%以上),可能需选取较多的主成分,此时主成分分析的降维作用就不明显。二是主成分分析只是一种“线性”降维技术,只能处理线性问题:一方面主成分是原始指标的线性组合,另一方面对原始数据进行标准化处理,使协方差矩阵变为相关系数矩阵,而相关系数矩阵只能反映指标间的“线性”相关程度。研究实际问题时,不仅指标间有非线性关系,有时主成分与原始数据之间也呈非线性关系,如果简单地进行线性处理,必然导致评价结果的偏差。因此有必要对传统主成

7、分的“线性化”进行改进。非线性主成分分析法有很多种[5][6],本文只介绍“对数中心化”的非线性主成分分析方法。对数中心化的基本方法为:设有P个指标的原始数据为(xij)n3p。1.对原始数据作中心对数化变换:p1yij=logxyj-6logxilPl=154数据统计与管理20卷2期2001年2.计算对数中心化的样本协方差矩阵S=(Sij)p×pn1sij=6(yli-yi)(ylj-yj)n-1l=1式中n1yi=6ylinl=13.从S出发求主成分设K1≥K2≥K3≥⋯≥Kp是S的P个特征根,a1,a2,a3⋯ap是相应的

8、标准化特征向量,则第i个非线性主成分为:pFl=6aljlogxljj=1余下的处理同于传统的主成分分析。从上述分析可知,非线性主成分分析与传统主成分分析相比有两处改进:一是通过对原始数据作对数中心化变换,将主成分表示为原始数据的非线性组合;二是分析的出发点是协

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。