欢迎来到天天文库
浏览记录
ID:38983186
大小:187.74 KB
页数:9页
时间:2019-06-22
《R语言学习系列24-频率表和列联表》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、22.频率表和列联表分类变量包括无序分类变量、有序分类变量。对于分类变量的描述统计,主要是对分类变量各水平值分别进行频数和比例计算,再进步计算所需的一些相对频数指标。一、一维列联表1.频数统计分类变量的分析,首先要了解:各类别的样本数(频数),以及占总样本量的百分比;对有序分类变量,还需要了解:累积频数、累积百分比。使用table()函数生成简单的频数统计表,基本格式为:table(var1,var2,…,varN)将N个分类变量(因子)创建一个N维列联表。library(vcd)#使用数据集Arthritishead(Arthritis,3)IDTreatmentSexAgeIm
2、proved157TreatedMale27Some246TreatedMale29None377TreatedMale30Nonemytable<-table(Arthritis$Improved)#统计频数mytableNoneSomeMarked421428prop.table(mytable)#将频数转化为比例值NoneSomeMarked0.50000000.16666670.3333333prop.table(mytable)*100#将频数转化为百分比NoneSomeMarked50.0000016.6666733.333332.集中/离散趋势观察原始频数,或者使用众
3、数。对于分类变量,集中/离散趋势是一体的。3.相对频数指标(1)比(Riatio)两个有关指标之比A/B,用来反映相对的大小关系,例如,月销售额/销售人数;(2)构成比用于描述事物内部各构成部分所占的比重,例如,百分比、累积百分比;(3)率(Rate)率是具有时间概念或速度、强度意义的指标,表示某个时期内某事件发生的频率或强度,例如速率、频率、费率、发病率等。二、二维列联表1.r×c二维列联表:(1)共n个样本;(2)按两种属性A、B,属性A有r个水平值:A1,…,Ar;属性B有c个水平值:B1,…,Bc.属性A=Ai,属性B=Bj的样本数为nij.(3)ni.=“属性A=Ai”的
4、合计数,n.j=“属性B=Bj”的合计数。注:多分类变量对应高维列联表。生成二维列联表使用函数table(),基本格式为:table(A,B)其中,A为行变量,B为列变量。或者使用函数xtabs(),基本格式为:xtabs(~A+B,data=mydata)其中,mydata为矩阵或数据框;要进行交叉分类的变量放在~右侧,以+作为分隔符,若某个变量写在~左侧,则为频数向量,常用于数据已经被表格化时。注:table函数默认忽略NA值,若要将NA值作为一个类别,需要使用参数useNA="ifany"mytable<-xtabs(~Treatment+Improved,data=Arth
5、ritis)#生成治疗方法与疗效的二维列联表(频数)mytableImprovedTreatmentNoneSomeMarkedPlacebo2977Treated13721prop.table(mytable)#各单元格占的比例(所有行列总和=1)ImprovedTreatmentNoneSomeMarkedPlacebo0.345238100.083333330.08333333Treated0.154761900.083333330.25000000margin.table(mytable,1)#对第1个变量(行变量)生成边际频数TreatmentPlaceboTreated
6、4341prop.table(mytable,1)#对第1个变量(行变量)生成边际比例(每行和=1)ImprovedTreatmentNoneSomeMarkedPlacebo0.67441860.16279070.1627907Treated0.31707320.17073170.5121951#可见与安慰剂组相比,治疗组的治愈率从16%提高到51%margin.table(mytable,2)#对第2个变量(列变量)生成边际频数ImprovedNoneSomeMarked421428prop.table(mytable,2)#对第2个变量(列变量)生成边际比例(每列和=1)Im
7、provedTreatmentNoneSomeMarkedPlacebo0.69047620.50000000.2500000Treated0.30952380.50000000.7500000addmargins(mytable)#将边际求和结果添加到表格(频数)ImprovedTreatmentNoneSomeMarkedSumPlacebo297743Treated1372141Sum42142884addmargins(prop.table(mytable))
此文档下载收益归作者所有