主成分分析外文文献==.doc

主成分分析外文文献==.doc

ID:53719275

大小:232.00 KB

页数:7页

时间:2020-04-06

主成分分析外文文献==.doc_第1页
主成分分析外文文献==.doc_第2页
主成分分析外文文献==.doc_第3页
主成分分析外文文献==.doc_第4页
主成分分析外文文献==.doc_第5页
资源描述:

《主成分分析外文文献==.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、软件第二次作业——基于软件的主成分分析学院:应用科学学院班级:统计11-1姓名:学号:一、主成分分析基本原理设对于某个问题的研究涉及到个指标,分别用表示,这个指标构成的维随机向量设为,对进行线性变换,可以通过线性组合的方式形成新的综合变量,这里用表示。新的综合变量和原来变量之间的关系可以用下面的公式表示:上式中的线性组合可以是任意的,由不同的线性变换得到的综合变量的统计特征也是不一样的。为了使综合变量可以比较好的描述原变量的特征,应该要让的方差尽可能的大,并且之间相互独立。为此,上式要满足以下的约束:1)

2、;2)和互不相关;3)是所有满足约束1的线性组合中方差最大的,是线性组合中方差第二大的,其他的依次类推。以上三条约束确定的分别为称为原始变量的第一,第二,…,第个主成分。各主成分对变量的总方差贡献率的大小不同,在实际的研究过程中,一般挑选前面几个方差最大的主成分(累计方差贡献率在80%到90%之间)来分析问题,从而达到降低问题复杂程度,抓住主要矛盾矛盾的目的。二、主成分分析过程一般而言,用主成分分析对问题进行分析时,主要包括以下的基本过程:1)为了消除不同变量在数量级和量纲上的差异,将收集的原始数据进行标

3、准化;2)求标准化后数据的相关矩阵;3)求相关矩阵的特征值和特征向量;4)根据特征值计算方差贡献率大于80%的原则,确定主成分为;5)构建综合评价函数,其数学形式为:6)根据综合评价函数计算总得分,然后排序并评价。三、R在主成分分析中的应用为了说明R软件是如何应用于因子分析中的,现以2004年城市综合发展水平为例。首先收集能反映我国2008年城市综合发展水平的12个指标和数据,这些指标分包括8个社会经济指标:非农业人口数(万人)(),工业总产值(万元)(),货运总量(万吨)(),批发零售住宿餐饮业从业人数

4、(万人)(),地方政府预算内收入(万元)(),城乡居民年底储蓄余额(万元)(),在岗职工人数(万人)(),在岗职工工资总额(万元)(),4个城市公共设施水平的指标:人均居住面积(平方米)(),每万人拥有公共汽车数(辆)(),人均拥有铺装道路面积(平方米)(),人均公共绿地面积(平方米)()。为了让R软件可以顺利读取数据,先将原数据整理到文本文档中,保存,并命名为sj。打开R软件,在其命令板中输入下列的命令:>sj<-read.table("sj.txt")#读取数据>names(sj)=c("非农业人口数

5、","工业总产值","货运总量","批发零售住宿餐饮业从业人数","地方政府预算内收入","城乡居民年底储蓄余额","在岗职工人数","在岗职工工资总额","人均居住面积","每万人拥有公共汽车数","人均拥有铺装道路面积","人均公共绿地面积")>sjt<-scale(sj)#将数据进行标准化>door<=cor(sjt)#求相关矩阵>dcor#输出的结果不是很清晰,故我们对结果做改善>symnum(dcor)#改善相关矩阵的结果xb7xb9xbbxc5xb5xb3在岗职工xc8非农业人口

6、数1工业总产值,1货运总量+,1批发零售住宿餐饮业从业人数,..1地方政府预算内收入,*+,1城乡居民年底储蓄余额...+.1在岗职工人数,,,,1在岗职工工资总额+,,+*+.人均居住面积每万人拥有公共汽车数.人均拥有铺装道路面积.人均公共绿地面积..在岗职工xb9人均xbexc3人均xd3人均xb9非农业人口数工业总产值货运总量批发零售住宿餐饮业从业人数地方政府预算内收入城乡居民年底储蓄余额在岗职工人数在岗职工工资总额1人均居住面积1每万人拥有公共汽车数.1人均拥有铺装道路面积.*1人均公共

7、绿地面积.,1attr(,"legend")[1]0‘’0.3‘.’0.6‘,’0.8‘+’0.9‘*’0.95‘B’1从输出的改善后的相关矩阵,我们可以看出原始变量之间有较强的相关性,进行因子分析是合适的。>deig<-eigen(dcor)#求相关矩阵的特征值个特征向量>deig$values#输出特征值[1]5.2.1.0.0.0.0.0.0.0.0.0.screeplot(psjt,type="line",main='碎石图',lwd=2)#对数据做碎石图从碎石图上可以看出,前三个因子波动幅度较大

8、说明他们携带的信息较多,而三个因子以后幅度明显较缓,故提取三个因子最为合适,下面验算一下前三个主成分的累计方差贡献率是否超过80%。>psjt<-princomp(sjt,cor=T)#对数据做主成分分析>psjt#输出结果,进行观察Call:princomp(x=sjt,cor=T)Standarddeviations:Comp.1Comp.2Comp.3Comp.4Comp.5Comp.6Comp.72.1.1.0.0.0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。