资源描述:
《R语言实战学习笔记-第五章.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第五章:高级数据管理5.2数值和字符处理函数l数学函数ceiling(x)不小于x的最小整数round(x,digits=n)四舍五入,保留n位floor(x)不大于x的最大整数signif(x,digits=n)指定位数的有效数字trunc(x)去尾取整log(x,base=n)对x取底为n的对数l统计函数mad(x)绝对中位差diff(x,lag=n)滞后差分quantile(x,probs)分位数scale(x,center=TRUE,scale=TRUE)为数据对象x进行中心化或标准化处理range(x)值域
2、l概率函数代码:设定随机数种子>runif(5)#生成0到1区间上服从均匀分布的伪随机数[1]0.0.0.0.0.>runif(5)[1]0.0.0.0.0.>set.seed(1234)#显式指定伪随机数种子>runif(5)[1]0.0.0.0.0.>set.seed(1234)>runif(5)[1]0.0.0.0.0.代码:生成多元正态数据>install.packages("MASS")>library(MASS)>options(digits=3)>set.seed(1234)>mean=c(230.7,
3、146.7,3.6)>sigma=matrix(c(15360.8,6721.2,-47.1,6721.2,4700.9,-16.5,-47.1,-16.5,0.3),nrow=3,ncol=3)>mydata<-mvrnorm(500,mean,sigma)>mydata<-as.data.frame(mydata)>names(mydata)<-c("Y","x1","x2")l字符处理函数nchar(x)计算x中的字符数量sub(pattern,replacement,x,ignore,case=F,fixed
4、=F)在x中搜索文本并进行替换substr(x,start,stop)替换向量中的子串grep(pattern,x,ignore,case=F,fixed=ForT)在x中搜索某种模式,返回正则表达式或下标strsplit(x,split,fixed=F)分割字符向量x的元素paste(…,seq=””)连接字符转,分隔符为seqtoupper(x)大写转换tolower(x)小写转换l其他函数length(x)x的长度cut(x,n)将x分割为n个因子seq(from,to,by)生成一个序列pretty(x,n)
5、创建美观的分割点rep(x,n)将x重复n次cat(…,file=””,append=F)连接…中的对象并输出l表示新行,t为制表符,’为单引号,b为退格l函数apply(),调用格式:apply(x,MARGIN,FUN,…),MARGEN=1表示行,2为列5.3数据处理难题的一套解决方案代码:将学生的各科考试成绩组合为单一的成绩衡量指标,给予相对名次给出从A到F的评分,根据学生的姓氏和名字的首字母对花名册进行排序。>options(digits=2)>student<-c("JohnDavis","An
6、gelaWilliams","BullwinkleMoose","DavidJones","JaniceMarkhammer","CherylCushing","ReuvenYtzrhak","GregKnox","JoelEngland","MaryRayburn")>math<-c(502,600,412,358,495,512,410,625,573,522)>science<-c(95,99,80,82,75,85,80,95,89,86)>english<-c(25,22,18,15,20,28,15,30
7、,27,18)>roster<-data.frame(student,math,science,english,stringsAsFactors=F)>z<-scale(roster[,2:4])>score<-apply(z,1,mean)>roster<-cbind(roster,score)>y<-quantile(score,c(.8,.6,.4,.2))>roster$grade[score>=y[1]]<-"A">roster$grade[score=y[2]]<-"B">rost
8、er$grade[score=y[3]]<-"C">roster$grade[score=y[4]]<-"D">roster$grade[scorename<-strsplit((roster$student),"")>lastname<-sapply(name,"[",2