country<-"> country<-" />
R语言实战学习笔记-第四章.doc

R语言实战学习笔记-第四章.doc

ID:54965644

大小:24.00 KB

页数:2页

时间:2020-04-25

R语言实战学习笔记-第四章.doc_第1页
R语言实战学习笔记-第四章.doc_第2页
资源描述:

《R语言实战学习笔记-第四章.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第四章基本数据管理4.1一个示例l代码:创建一个数据框>manager<-c(1,2,3,4,5)>date<-c("10/24/08","10/28/08","10/1/08","10/12/08","5/1/09")>country<-c("US","US","UK","UK","UK")>gender<-c("M","F","F","M","F")>age<-c(32,45,25,39,99)>q1<-c(5,3,3,3,2)>q2<-c(4,5,5,3,2)>q3<-c(5,2,5,4,1)>q4<-c(5,5,5,NA,2)>q5<-c(5,5,2,NA,1)>le

2、adership<-data.frame(manager,date,country,gender,age,q1,q2,q3,q4,q5,stringAsFactors=F)4.2创建新变量l算术运算符:x%%y取余;x%/%y取整l代码:创建新变量:>mydata<-data.frame(x1=c(2,2,6,4),x2=c(3,4,2,8))方法一:>mydata$sum<-mydata$x1+mydata$x2>mydata$mean<-(mydata$x1+mydata$x2)/2方法二:>attach(mydata)>mydata$sumx<-x1+x2>mydata

3、$mean<-(x1+x2)/2>detach(mydata)方法三:(此方法将运算结果保存在了原始数据表格里)>mydata<-transform(mydata,sumx=x1+x2,meanx=(x1+x2)/2)>mydata4.3变量的重编码l逻辑运算符:==严格等于;!=不等于;!x非x;x

4、yx或y;x&yx和y;isTRUE(x)测试x是否为真l代码:将leadership表的连续型年龄变量重编码为类别型变量>leadership$age[leadership$age==99]<-NA方法一:>leadership$agecat[leadership$age>7

5、5]<-"Elder">leadership$agecat[leadership$age>=55&leadership$age<=75]<-"MiddleAged">leadership$agecat[leadership$age<55]<-"Young"方法二:>leadership<-within(leadership,{agecat<-NAagecat[age>75]<-"Elder"agecat[age>=55&age<=75]<-"MiddleAged"agecat[age<55]<-"Young"})4.4变量的重命名l直接调用交互式编辑器:fix(leaders

6、hip);l编程形式:reshape函数包里的rename()函数调用格式为:rename(dataframe,c(oldname=”newname”,”oldname”=”newname”,…))例:>install.packages("reshape")>library(reshape)>leadership<-rename(leadership,c(manager="managerID",date="testDate"))l通过names()函数来重命名变量例:>names(leadership)[2]<-"testDate"4.5缺失值l检测缺失值是否存在:函数is.

7、na()例:>y<-c(1,2,3,NA)>is.na(y)输出[1]FALSEFALSEFALSETRUEl重编码某些值为缺失值例:>leadership$age[leadership$age==99]<-NAl在分析中排除缺失值删除所有包含缺失值数据的行:函数na.omit()例:>newdata<-na.omit(leadership)4.6日期值l日期格式:%d数字表示的日期,%a缩写的星期名,%A非缩写星期名,%m月份,%b缩写的月份,%B非缩写月份,%y两位数年份,%Y四位数年份l将字符串形式日期化为数值形式:as.date()函数调用格式:as.Date(x,”

8、input_pormat”)例:>mydate<-as.Date(c(“2007-06-22”,”2004-02-13”))l转换日期格式>strDates<-c("01/05/1965","08/16/1975")>dates<-as.Date(sreDates,"%m/%d/%Y")输出>dates[1]"1965-01-05""1975-08-16"l输出当前日期和时间>Sys.Date()>date()4.9数据集的合并l添加列:merge()函数调用格式:total<-merge(datafr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。