head(data)#前六行数据>attach(data)>options(digits=2)>data=as.matrix(data)#转化为矩阵>v1<-eige"> head(data)#前六行数据>attach(data)>options(digits=2)>data=as.matrix(data)#转化为矩阵>v1<-eige" />

主成分分析R语言.doc

ID:51259507

大小:125.97 KB

页数:6页

时间:2020-03-20

主成分分析R语言.doc_第1页
主成分分析R语言.doc_第2页
主成分分析R语言.doc_第3页
主成分分析R语言.doc_第4页
主成分分析R语言.doc_第5页
资源描述:

《主成分分析R语言.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第一题>data=read.table("q1.txt",head=T)>head(data)#前六行数据>attach(data)>options(digits=2)>data=as.matrix(data)#转化为矩阵>v1<-eigen(data)#计算相关系数矩阵特征值和特征向量>v1>zhuchengfen<-princomp(covmat=data)#用相关系数矩阵做主成分分析>summary(zhuchengfen)>x<-zhuchengfen$loadings;x#主成分载荷>y

2、<-zhuchengfen$scores;y#主成分得分因为只有相关系数矩阵,所以没有主成分的得分>screeplot(zhuchengfen,type="lines")根据累计方差贡献率和Kaiser准则,应该选择三个主成分,即PC1、PC2、PC3。累计方差贡献率为64%。PC1、PC2、PC3对方差贡献率分别是38%、15%、11%。结果如下:运动项目第一主成分第二主成分第三主成分100米-0.355-0.1760.493跳远-0.405-0.1490.182铅球-0.3610.434跳高-

3、0.346-0.109-0.131400米-0.318-0.447110米跨栏-0.3530.153铁饼-0.3190.423-0.104撑杆跳高-0.277-0.389标枪-0.2230.356-0.3521500米-0.484-0.623方差贡献率0.380.150.11累积方差贡献率0.380.530.64解释:前三个主成分解释了大部分信息;第一次主成分测量的是综合运动能力,第二个主成分代表了爆发力臂力,第三主成分测量的是爆发性腿力。附录:这是psych软件包中计算主成分的结果,主成分载荷与

4、princomp得到的结果有很大的差异,并且这个结果似乎更容易解释第二题>library(RODBC)>data=odbcConnectExcel("G:/R/q2.xls")>data1=sqlFetch(data,"Sheet1")>close(data)#关闭通道>attach(data1)>head(data1)#查看前六行数据>data2=data1[,-1]#去掉第一列数据>options(digits=2)#数据均保留小数点后两位>q2<-princomp(data2,cor=T)#

5、用相关系数矩阵做主成分分析>options(digits=2)#数据均保留小数点后两位>summary(q2)第一主成分对数据方差的解释度达到83%,因此我们只需要选择一个主成分,即第一主成分PC1>x<-q2$loadings;x#主成分载荷令,……分别代表100m(s)、200m(s)……Marathon(min)的成绩,那么第一主成分的表达式:第一主成分中各个运动项所占的比例非常接近,因此它衡量的是一个人的综合运动能力,且方差的贡献度达到83%。>y<-q2$scores;y[,1]#第一主

6、成分得分>order(y[,1])#排序>png("normal.png")>qqnorm(y[,1],main="FirstPC")#正态性检验>qqline(y[,1])>dev.off()由第一主成分的Q-Q图可以看出,除少数离群点之外,大部分点都在理论值附近,可以看成是近似服从多元正态分布。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
正文描述:

《主成分分析R语言.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第一题>data=read.table("q1.txt",head=T)>head(data)#前六行数据>attach(data)>options(digits=2)>data=as.matrix(data)#转化为矩阵>v1<-eigen(data)#计算相关系数矩阵特征值和特征向量>v1>zhuchengfen<-princomp(covmat=data)#用相关系数矩阵做主成分分析>summary(zhuchengfen)>x<-zhuchengfen$loadings;x#主成分载荷>y

2、<-zhuchengfen$scores;y#主成分得分因为只有相关系数矩阵,所以没有主成分的得分>screeplot(zhuchengfen,type="lines")根据累计方差贡献率和Kaiser准则,应该选择三个主成分,即PC1、PC2、PC3。累计方差贡献率为64%。PC1、PC2、PC3对方差贡献率分别是38%、15%、11%。结果如下:运动项目第一主成分第二主成分第三主成分100米-0.355-0.1760.493跳远-0.405-0.1490.182铅球-0.3610.434跳高-

3、0.346-0.109-0.131400米-0.318-0.447110米跨栏-0.3530.153铁饼-0.3190.423-0.104撑杆跳高-0.277-0.389标枪-0.2230.356-0.3521500米-0.484-0.623方差贡献率0.380.150.11累积方差贡献率0.380.530.64解释:前三个主成分解释了大部分信息;第一次主成分测量的是综合运动能力,第二个主成分代表了爆发力臂力,第三主成分测量的是爆发性腿力。附录:这是psych软件包中计算主成分的结果,主成分载荷与

4、princomp得到的结果有很大的差异,并且这个结果似乎更容易解释第二题>library(RODBC)>data=odbcConnectExcel("G:/R/q2.xls")>data1=sqlFetch(data,"Sheet1")>close(data)#关闭通道>attach(data1)>head(data1)#查看前六行数据>data2=data1[,-1]#去掉第一列数据>options(digits=2)#数据均保留小数点后两位>q2<-princomp(data2,cor=T)#

5、用相关系数矩阵做主成分分析>options(digits=2)#数据均保留小数点后两位>summary(q2)第一主成分对数据方差的解释度达到83%,因此我们只需要选择一个主成分,即第一主成分PC1>x<-q2$loadings;x#主成分载荷令,……分别代表100m(s)、200m(s)……Marathon(min)的成绩,那么第一主成分的表达式:第一主成分中各个运动项所占的比例非常接近,因此它衡量的是一个人的综合运动能力,且方差的贡献度达到83%。>y<-q2$scores;y[,1]#第一主

6、成分得分>order(y[,1])#排序>png("normal.png")>qqnorm(y[,1],main="FirstPC")#正态性检验>qqline(y[,1])>dev.off()由第一主成分的Q-Q图可以看出,除少数离群点之外,大部分点都在理论值附近,可以看成是近似服从多元正态分布。

显示全部收起
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭