欢迎来到天天文库
浏览记录
ID:41117489
大小:67.52 KB
页数:7页
时间:2019-08-16
《R语言作图之PCA作图和散点图》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、PCA分析和散点图今天主要跟大家演示一下简单的PCA分析,并且以散点图的形式将结果展示出来。首先在进行PCA分析之前,先跟大家稍微讨论下什么是PCA分析。PCA分析又叫主成分分析,其实从字面上来理解我们可以发现它其实是和样品分组相关的。举个简单的例子,我们观察了某种植物的株高、叶片大小、果实大小等等多种性状,并记录每种性状对应的数值。这时候我们想看看根据这些性状信息看看我们观察的样本是否明显的分组现象。每一种性状相当于一个维度。利用PCA分析可以将结果投影到一个低维的向量空间(具体计算就不详述了)。类似的比
2、如我们多个样本的表达谱数据,每个基因在各个样品的表达情况就可以算作一个维度。如果大家对PCA算法感兴趣的话,可以自行百度,在这里就不进行太多的描述了。毕竟今天主要是教大家怎么利用R进行PCA分析和结果展示。还是第一步,我们先准备好我们用来分析的数据。setwd("C:/Users/gaom/Desktop")#打开文件所在路径,并将文件所在目录作为工作目录data<-read.table(file="test_data.txt",header=T,sep="t")#读取数据,并将首行作为列名dim(dat
3、a)##[1]299913head(data)##ID_REFT01T02T03T04T05T06##11007_s_at10.19858611.80567610.86795311.76366012.07223212.108312##21053_at9.5940748.7131089.2470969.4332659.0923299.005518##3117_at8.5817638.6036808.8044258.6617008.6349798.606976##4121_at12.02231512.65532
4、912.62733412.79139012.96176112.885307##51255_g_at7.2285697.2146007.2371317.2934177.2767997.268233##61294_at8.8284879.3802779.2979898.8589858.9957729.126825##T07T08T09T10T11T12##110.64686810.85274410.67589811.13766310.79673711.102408##29.0876819.0272088.965
5、2838.9583099.2750108.940965##38.6258388.5772448.6467518.6258438.6251648.522129##413.40204413.24012613.08888313.23409913.38290313.472223##57.1974407.2626627.2897967.2322497.2023647.306229##69.0023859.0035619.0062789.0067219.0181839.164313上述数据为从GEO数据库随意找的基因表
6、达。其中第一列为基因探针号,后续几列则为T01到T12的12个样品对应的表达量数据,每三个样品为一组。因为数据是拼凑的,所以这里不关注探针具体信息了。准备好数据之后我们就开始进行PCA计算了。其实代码非常简单。pca<-prcomp(t(data[,-1]),scale=T)head(pca$x)##PC1PC2PC3PC4PC5PC6##T01-43.457435-44.9500318.3055713.210563-7.428048114.818150##T0242.067255-19.142248-25
7、.57404121.120294-5.793099014.702922##T03-2.123455-21.512488-11.19247417.58300615.2149034-34.730308##T048.166077-4.77481422.837578-11.3641288.4021038-6.921738##T0518.214073-5.83680718.522768-10.941626-0.6183613-5.548845##T0627.219529-5.51932826.649872-11.05
8、4961-4.14804135.097715##PC7PC8PC9PC10PC11PC12##T01-1.9663429.2181269-1.520882-1.0608353.0484982.731227e-13##T025.8321978.97930189.3861871.6687611.7054742.674666e-13##T03-5.168168-9.7483411-11.5703202.618203-4
此文档下载收益归作者所有