《因子与列表》PPT课件

《因子与列表》PPT课件

ID:39448625

大小:723.60 KB

页数:37页

时间:2019-07-03

《因子与列表》PPT课件_第1页
《因子与列表》PPT课件_第2页
《因子与列表》PPT课件_第3页
《因子与列表》PPT课件_第4页
《因子与列表》PPT课件_第5页
资源描述:

《《因子与列表》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、实验内容1、数据表示方法2、应用实例3、实验作业学习R语言中离散变量、混合数据的表示方法实验目的因子、列表、数据框因子(factor)和有序因子统计中的变量重要类别:区间变量和名义变量、有序变量。区间变量取连续的数值,可以进行求和、平均等运算。名义变量和有序变量取离散值,既可用数值代表也可用字符型值,其具体数值没有数量意义,不能用于加减乘除计算而只能用来分类或者计数。名义变量比如性别、省份、职业,有序变量比如班级名次、质量等级。因为离散变量有各种不同表示方法,在R中为统一起见使用因子(factor)来表示这种分类变量。还提供了有序因子(orderedfactor)

2、来表示有序变量。因子是一种特殊的字符型向量,其中每一个元素取一组离散值中的一个,而因子对象有一个特殊属性levels表示这组离散值(用字符串表示)。例如:>x<-c("男","女","男","男","女")>y<-factor(x)>y[1]男女男男女Levels:男女函数factor()用来把一个向量编码成为一个因子。一般形式为:factor(x,levels=sort(unique(x),na.last=TRUE),labels,exclude=NA,ordered=FALSE)可以自行指定各离散取值水平(levels),不指定时由x的不同值来求得。label

3、s可以用来指定各水平的标签,不指定时用各离散取值的对应字符串。exclude参数用来指定要转换为缺失值(NA)的元素值集合。ordered取真值时表示因子水平是有次序的(按编码次序)。可以用is.factor()检验对象是否因子,用as.factor()把一个向量转换成一个因子。>x<-c(1,2,3,3);>y<-factor(x);y;[1]1233Levels:123>factor(x,order=T)[1]1322Levels:1<2<3>factor(x,label=c("red","black","white"))[1]redblackwhitewhi

4、teLevels:redblackwhite>factor(x,label=c("red","black","white"),order=T)[1]redblackwhitewhiteLevels:redfactor(x,exclude=3,order=T)[1]12Levels:1<2>x<-c(1,0,1,1,0)>y=factor(x,levels=sort(unique(x),decreasing=T),labels=c("男","女"),order=F)>y[1]男女男男女Levels:男女>x<-c(1,0,1

5、,1,0,2)>y=factor(x,levels=c(1,0),labels=c("男","女"),order=F)>y[1]男女男男女Levels:男女因子的基本统计是频数统计,用函数table()来计数。例如,>sex=factor(c("男","女","男","男","女"))>res.tab<-table(sex)>res.tab[1]男女32表示男性3人,女性2人。table()的结果是一个带元素名的向量,元素名为因子水平,元素值为该水平的出现频数。可以用两个或多个因子进行交叉分类。比如,性别(sex)和职业(job)交叉分组可以用table(

6、sex,job)来统计每一交叉类的频数,结果为一个矩阵,矩阵带有行名和列名,分别为两个因子的各水平名。>job=factor(c("teacher","worker","worker","worker","teacher"));>sex=factor(c("男","女","男","男","女"));>table(sex,job);jobsexteacherworker男12女11因子可以用来作为另外的同长度变量的分类变量。比如,假设上面的sex是5个学生的性别,而>h<-c(165,170,168,172,159)#5个学生的身高,则>tapply(h,sex,m

7、ean)#求按性别分类的身高平均值这样用一个等长的因子向量对一个数值向量分组的办法叫做不规则数组(raggedarray)。后面我们还可以看到更多的因子的应用。因子还可以用gl()函数来产生,其用法为:>gl(n,k,length=n*k,labels=1:n,ordered=FALSE)n是水平数;k为重复的次数;length是结果的长度;labels是一个n维向量,表示因子的水平;ordered是逻辑变量,表示是否为有序因子,默认值为FALSE。>gl(3,5)[1]111112222233333Levels:123>gl(3,1,9)[1]123123123

8、Level

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。