R语言分组因子、数组、数据单处理

R语言分组因子、数组、数据单处理

ID:21270228

大小:877.00 KB

页数:39页

时间:2018-10-20

R语言分组因子、数组、数据单处理_第1页
R语言分组因子、数组、数据单处理_第2页
R语言分组因子、数组、数据单处理_第3页
R语言分组因子、数组、数据单处理_第4页
R语言分组因子、数组、数据单处理_第5页
资源描述:

《R语言分组因子、数组、数据单处理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章分组因子R语言可以将一套数据中相同分类的数据进行分组,然后可以方便的进行聚集计算。4.1分组因子4.2聚集计算4.3排序分组因子是一个表示分类分组的方法的对象。在R语言中,通过使用分组因子定义不同的分组方法,然后在对分组数据进行相应计算。可以使用factor()函数生成一个分组因子。调用格式为:先列举所有数据,然后levels列举分组数据。4.1分组因子例题>read.csv(file=file.choose(),header=T)->team;>team;>factor(TEAM)->TeamFactor;>levels(TEAM);4.2聚集计算聚集计算是将同一组数据进

2、行分组计算。函数tapply(X,INDEX,FUN=NULL,...,simplify=TRUE)X:聚集计算的数据对象,INDEX:相应的分组因子,FUN:聚集计算的函数。(1)各组工作时间>tapply(WORLTIME,TeamFactor,sum)=SumWorktimeByTeam;>SumWorktimeByTeam;(2)各组平均工作时间>average=function(x)sum(x)/length(x);>tapply(WORLTIME,TeamFactor,average)=AverageWorktimeByTeam;>AversgeWorktimeByT

3、eam;(3)TEAM中各LEVEL人员的工作时间>factor(LEVEL)->LevelFactor;>list(TeamFactor,LevelFactor)=TLFactor;>tapply(WORLTIME,TLFactor,sum)=SumWorktimeByTL;4.3排序在R语言系统中,分组因子缺省按照字母的顺序排序,我们可以利用order()函数产生定制的排序函数。例:按照CLIENT、BATCH、ONLINE的顺序形成分组因子。>ordered(TEAM,c("CLIENT","BATCH",“ONLINE”))=TeamFactor;>TeamFactor;

4、第五章数组和矩阵数组和矩阵是R语言中的基本数据模式。数组可以看成带多个下标的、类型相同的元素的多维数据集合,常用的是数值型的数组如矩阵。5.1定义数组5.2数组子集操作5.3构造数组5.4数组计算5.5矩阵5.6数组矩阵合并5.7定义数组的操作5.1定义数组在R语言中可以通过定义维度向量来定义数组的维度。维度向量是正整数向量,其长度是数组的维度,各数值表示各维度数据的长度。定义了各向量维度之后,语言就会将其作为数组处理。(1)函数dim(a,b,c)定义数组的维数。可以简单理解(a,b)为一个二维数组的行和列,c为二维数组的个数。(2)函数attributes()可以获取Firs

5、tArray对象的特征属性。例如:>attributes(FirstArray)例:一个有24个数值的向量,并将其定义成3*4*2的数组>FirstArray=seq(1:24);>dim(FirstArray)=c(3,4,2);>FirstArray,,1#第一组3*4矩阵[,1][,2][,3][,4][1,]14710[2,]25811[3,]36912,,2#第二组3*4矩阵[,1][,2][,3][,4][1,]13161922[2,]14172023[3,]151821245.2数组子集操作一、下标操作在R语言中,可以在[]中使用下标操作获取数组的子集,其基本形式为

6、:Array_Name[Index_Vector](其中Array_Name为数组名,Index_Vector为下标向量)。例一:>FirstArray[,,2]#第三维下标为2的所有数据。>FirstArray[3,,]#第一维下标为3的所有数据。注:FirstArray[,,]是整个数组。例二、根据下标向量取数据>FirstArray[2:3,2:4,1][,1][,2][,3][1,]5811[2,]6912例三、利用dim()函数获取一个数组的维数>dim(FirstArray)->FirstArrayDim>FirstArrayDim[1]342注:此处的赋值不能用“=

7、”例四、使用下标向量访问数组>FirstArray[1,2,2]<-NA>Index=c(2,4,23,9);>FirstArray[Index][1]24239>FirstArray[-Index][1]135678101112131415NA17181920212224>FirstArray[!is.na(FirstArray)][1]1234567891011121314151718192021222324二、下标数组在R语言中,可以用下标数组访问数组的子集,保存下标数组要

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。