资源描述:
《R语言基础知识合集,word版.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、R语言基础1.在业界,用Stata的很少,不到百分之十,而用R的非常多,可以说是一种generalanalysisway。但是python也是众多人青睐的软件之一。2.R语言的优缺点:优点:可以做任何想做的东西,比如:作图,做PPT,做动画,做网页,做模型等等。(PS:Spss和SAS都是基于R上研发的,落后至少有三到四年,但是他们是基于硬盘运行的,而R是基于内存运行的)缺点:1.前期难学,突破瓶颈比较难。2.过多的安装包供选择,会使选择困难。3.容易出错,而且还不知道错在哪里。4.在内存中运行,不利于大数据运算。3.R语言找帮助:1.Quick-R(里面与很多练习的小例子,可以用来基础
2、者学习)2.Rseek3.Cross-validated4.R语言中Data存在的五种形式:1.Numeric(数值型):numeric[eg.1,2,3,pi]2.Integer(整数型):[eg.1,typesas1L](L即为整数)3.Complex(复数型):[eg.1+2i,real+imaginary]4.Logicalboolean(逻辑型):[eg.TRUEorFALSE,TorF]5.Character(字符型):strings["Economitric"with"R"]例子:X<-c["R",2,FALSE]class(X)#查看X,结果显示都为Character型,
3、说明字符型优先于所有的型。[1]"R""2""FALSE"X<-c[2,FALSE]class(X)[1]20#显示全为数值型,说明数值型优先于逻辑型5.R语言中的向量1.生成字母向量a<-c(letters[1:4])#小写字母四个orA<-c(LETTERS[1:4])[1]abcd2.生成数值向量a<-c[1:100]#从一到一百3.特征量meanvara+14.向量里面的每个值的长度(尤其是字母向量)nchar(B)[1]1111B(2)<-Bing#将B里面的第二个量改成Bingnchar(B)[1]14115.输入变量有哪些ls()[1]abB6.移除现有的变量rm(a)7.
4、向量间隔seq(1,100)#从一到一百,默认间隔为一seq(1,100,by=3)#间隔为3seq(1,100,length=1000)#在一到一百之间等间隔选出1000个数8.重复向量rep(10,10)#重复10,10遍rep(x=1:5,times=3)#从一到五重复三遍[1]1234543212345rep(x=1:5,each=3)#从一到五每个数重复三遍[1]111222333444555rep(x=1:5,each=3,times=3)#从一到五每个数重复三遍后在重复三遍[1]111222333444555444333222111...9.向量按正态分布抽取数据x<-rn
5、orm(100)#从标准正太态布中随机抽一百个数x<-rnorm(100,175,8)#从均值为175以及标准差为8的正态分布中随机抽100个数10.数据展现索引x<-[1:10]#展现一到十head(1:10)#展示开头一到十个数据tail(1:10)#展现结尾一到十个数据x<0.5#索引那些小于0.5的数据,小于的显示TRUE不小于的显示FALSEx[x<0.5]#索引那些小于0.5的具体数据length(x[x<0.5])#展示小于0.5的数据的个数11.TRUE和FALSE的应用y<-1:5y[c(T,T,F,T,F)]#为T的数据保留,为F的数据去除[1]124y[c(T,F,
6、T)]#后面未配有逻辑型的默认保留[1]134512.逻辑语言“或”“且”“非”的应用length(x[-0.57、0.58、x[x!=0.5]#不等于0.5,即“非”(No)的应用!eg.a<-1:5a!=2[1]TRUEFALSETRUETRUETRUE6.R语言中的矩阵1.生成矩阵a<-matrix(0,3,4)#构建三行四列的矩阵,数据都为0[1]000000000000a<-matrix
9、(0:11,3,4)#构建三行四列的矩阵,数据从零到十一(从上到下,后从左到右派数据)[1]03691471025811a<-matrix(0:11,3,4,byrow=T)#构建三行四列的矩阵,数据从零到十一(从左到右,后从上到下派数据)[1]012345678910112.矩阵的合并a<-0:2b<-3:5c<-8:10cbind(a,b,c)#将他们以列绑起来[1]0381492510rbind(a,b,c)#将他们以行绑起来