欢迎来到天天文库
浏览记录
ID:32409404
大小:1.40 MB
页数:6页
时间:2019-02-04
《科研方法专题-四川省精神卫生中心》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、http://www.psychjm.net.cn四川精神卫生2018年第31卷第2期·科研方法专题·基于SAS与R软件的主成分分析胡良平1,2*(1.军事科学院研究生院,北京100850;2.世界中医药学会联合会临床科研统计学专业委员会,北京100029*通信作者:胡良平,E-mail:lphu812@sina.com)【摘要】本文目的是介绍主成分分析的概念、作用和用软件实现计算的方法。应弄清适合进行主成分分析的数据结构、如何利用SAS和R软件实现计算的具体方法,尤其是计算结果的解释和利用。值
2、得注意的是:满足同质性的单组设计多元定量资料是适合进行主成分分析的数据结构的突出特点;主成分分析可用于下列场合:数据降维、主成分回归分析和主成分聚类分析等。【关键词】主成分分析;降维;相关矩阵;特征值;特征向量中图分类号:R195.1文献标识码:Adoi:10.11886/j.issn.1007-3256.2018.02.007PrincipalcomponentsanalysisbasedonSASandRsoftware1,2*HuLiangping(1.GraduateSchool,Aca
3、demyofMilitarySciencesPLAChina,Beijing100850,China;2.SpecialtyCommitteeofClinicalScientificResearchStatisticsofWorldFederationofChineseMedicineSocieties,Beijing100029,China*Correspondingauthor:HuLiangping,E-mail:lphu812@sina.com)【Abstract】Thispaperai
4、medatintroducingtheconcepts,functionsandcalculationbasedonsoftwareoftheprincipalcomponentsanalysis.ItisimportanttofindoutthedatastructurewhicharesuitablefortheprincipalcomponentsanalysisandtheconcretecalculationapproachbySASandRsoftwarespeciallytheme
5、thodsofinterpretationandutilizationofthecalculatedresults.Itisremarkablethatthedatastructurewithhomogenizationshouldbesuitableforimplementingtheprincipalcomponentsanalysis,whichcanbeusedinthefollowingsituations,suchasthedatadimensionalityreduction,th
6、eprincipalcomponentsregressionanalysisandtheprincipalcomponentsclusteranalysisandsoon.【Keywords】Principalcomponentsanalysis;Dimensionalityreduction;Correlationmatrix;Eigenvalue;Eigenvector分析方法。它是将彼此相关的一组变量转化为彼此1概述独立的一组新变量,并以其中少数的几个新变量综合1.1基本概念反映原先多个变
7、量所包含的主要信息,且这少数几个综合变量具有独特的专业含义。主成分变量实际上在科学研究中,经常需要从同一个体(或观测单位)上观测多个指标,这些指标从不同方面反映就是由原变量X1~Xm线性组合出来的m个互不相个体的性质。但指标太多,不仅会增加计算的复杂关、且未丢失任何信息的新变量,也称为综合变量。性,也会给合理分析问题和解释问题带来困难。表1.3主成分分析的作用面上,各指标之间地位相同。实际上,各指标所包含的信息量参差不齐,且指标间往往不是相互独立的,多指标的主成分变量常被用来揭示某种事物或它们所
8、包含的信息有交叉或重叠的部分。所以,需现象内在规律性的综合指标,研究者结合基本常识要对众多指标进行适当的处理,以便更好地反映事和专业知识对综合指标所蕴藏的信息予以恰当解物的本质特征。释,就可以更深刻地揭示事物的内在规律。主要应用于以下三个方面:①降维,即利用较少的几个主成1.2何为主成分分析分变量就可以取代原来众多的变量所承载的信息;主成分分析(principalcomponentsanalysis)是将②基于消除多重线性回归分析中自变量间共线性关多个定量指标转换为少数几个综合指标的一种统计系之
此文档下载收益归作者所有