资源描述:
《一种用于综合评价的主成分分析改进方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第14卷第1期西安文理学院学报:自然科学版Vol.14No.1,2011年1月JournalofXianUniversityofArts&Science(NatSciEd)Jan.2011文章编号:100825564(2011)0120105204一种用于综合评价的主成分分析改进方法高艳,于飞(哈尔滨工程大学理学院,黑龙江哈尔滨150001)摘要:主成分分析是多元统计分析中的降维技术,在用于综合评价时,在不损失原有信息的基础上,主成分分析结果易受异常值的影响,分析结果稳定性差.针对该问题,文中提出一种改进的主成分分析方法,该方法先通过惯性系数加权的方式对原始指标进行分级优化,再利用
2、均值化的思想对其进行处理.实验结果表明,该方法有效地弱化了异常值的影响,增强了分析结果的稳定性,同时具有良好的降维效果.关键词:主成分分析;综合评价;异常值影响;均值化;惯性系数中图分类号:O212.4文献标识码:AAModifiedPrincipalComponentAnalysisAlgorithmForComprehensiveEvaluationGAOYan,YUFei(CollegeofScience,HarbinEngineeringUniversity,Harbin150001,China)Abstract:Principalcomponentanalysisison
3、eofthetechniquesofdimensionalityreductioninthemultivariatestatisticalanalysis.Whenappliedincomprehensiveevaluationwithnolossoforiginalinformation,theprincipalcomponentanalysisalgorithmisvulnerabletotheabnormalvalueandthestabilityofitsresultcannotbeguaranteed.Toaddressthisproblem,amodifiedalgor
4、ithmwasgiveninthisstudy.Inthenewmodel,theoriginalindexvaluesaregradedandoptimizedwithinertialcoefficientandthenprocessedwithequalization.Theexperimentalre2sultsshowedthatthenewmethodwasmorestableandmoreeffectiveinweakeningtheimpactoftheabnormalvalue.Meanwhile,ithadagoodeffectonthedimensionredu
5、ction.Keywords:principalcomponentanalysis;comprehensiveevaluation;impactofabnormalval2ue;equalization;inertialcoefficient主成分分析是由霍特林于1933年首先提出的,是多元统计分析中降维技术之一,是在原始信息损失很少的情况下,对数据的特征信息进行提取的一种方法.通常把转化生成的综合指标值称之为主成[1]分,其中每个主成分可以表示成原始信息的线性组合,各个主成分之间彼此独立且不相关.作为用几个较少的具有代表性的综合指标代替较多的原始指标的一种统计方法,主成分分析克服
6、了综合评价中人为确定各指标权重系数的不足,因此它在综合评价中显示了它的优越性.但是,原始的主成分分析通常是以样本的相关矩阵(或协方差矩阵)为基础进行分析,而相关矩阵对异常值极为敏感,异常值间接影响到了最后以主成分(综合指标)的得分多少进行综合评价的结果;同时,原始的主成分分析的降维收稿日期:2010209205作者简介:高艳(1985—),女,黑龙江哈尔滨人,哈尔滨工程大学理学院硕士研究生.研究方向:系统与控制.106西安文理学院学报:自然科学版第14卷[2-3]效果不明显,难以确定综合评定的主要因子.针对在使用主成分分析进行综合评定时易受异常值影响及降维效果不明显的不足,本文提出
7、了用于综合评价的主成分分析改进方法.在综合评价时,首先通过惯性系数加权法将指标信息进行优化,再对优化后的指标进行均值化处理,进而弱化了异常值对评价结果的影响,同时具有很好的降维效果.本文使用该方法对哈市某高校的学生成绩进行了分析,对比原始的主成分分析方法,取得了较好的结果.1主成分分析方法的改进在进行综合评价时,在原始的主成分分析模型的基础上,首先对原始数据进行处理.处理时,原始指标通过变换转化成优化指标,同时为每个原始指标赋予一个惯性系数用以弱化指标信息的差异性,进