欢迎来到天天文库
浏览记录
ID:33454529
大小:259.85 KB
页数:11页
时间:2019-02-26
《sas学习系列16. 绘图ⅱ—条形图,直方图,盒形图》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、16.绘图Ⅱ—条形图,直方图,盒形图(一)定性变量的图形定性变量(分类变量)也可以通过图形直观地描绘出它们各类的数量和所占比例,常用的有条形图、饼形图和马赛克图。一、条形图(BarChart)用若干个细长的矩形条的高度(不是宽度,也不是面积)来表示定性变量各水平组的频数。分为单式条形图——横轴上只有一个定性变量;复式条形图——横轴上有两个或多个定性变量(GROUP可选项);基本语法:PROCSGPLOTdata=数据集;VBAR或HBAR变量列表可选项>;注:“VBAR”绘制竖直方向的条形图,“HBAR”绘制水平方
2、向的条形图。可选项:GROUP=变量名指定分组变量GROUPDISPLAY=选项指定分组条形的显示方式:STACK(堆叠型,默认),CLUSTER(簇型);RESPONSE=变量名指定一个数值变量做统计分析;STAT=统计量对RESPONSE变量做指定的统计分析;有RESPONSE变量默认FREQ;否则默认SUM;ALPHA=p设定置信限:[0,1],默认为0.05(95%可信)BARWIDTH=w设定“条形”宽度,介于0.1和1之间,默认为0.8;DISCRETEOFFSET=x设定每个条形偏移中心的距离:[-0.5
3、,0.5],默认为0TRANSPARENCY=n指定条形的透明度:[0,1],默认是0(完全不透明)DATALABEL=变量名指定用该变量的值作为每个“条形”的标签,默认SAS自动计算适当的值MISSING绘制包含缺省值的条形;LIMITSTAT=选项设定要显示的极限线的类型:CLM(均值左右95%的双侧置信区间);STDDEV(样本标准差);STDERR(标准误);例1巧克力生产商考虑是否增加4个新品种,公司找志愿者品尝它们的味道,得到数据(C:MyRawDataChoc.dat),变量包括年龄组(A-成年;C-
4、儿童)、喜欢吃的口味(注意每行有6个测试):读入数据,用PROCSGPLOT过程步生成关于年龄段分组的条形图。代码:datachocolate;infile'c:MyRawDataChoc.dat';inputAgeGroup$FavoriteFlavor$@@;run;procformat;value$AgeGp'A'='Adult''C'='Child';run;*Barchartforfavoriteflavor;procsgplotdata=chocolate;vbarFavoriteFlavor/GROU
5、P=AgeGroupGROUPDISPLAY=CLUSTER;formatAgeGroup$AgeGp.;labelFavoriteFlavor='FlavorofChocolate';title'FavoriteChocolateFlavorsbyAge';run;运行结果:注:上图是“簇型”(CLUSTER),若改为“堆叠型”(STACK)输出:另外,可以用旧版的GCHART过程步绘制条形图;二、饼图(PieChart)饼图,用圆的各扇形面积的大小来表示定性变量各水平组的频数。SGPLOT过程步没有提供绘制饼形图的
6、命令,用GCHART过程步可以实现。例2细菌培养的数据(C:MyRawDatabacterial.txt),变量包括细菌类别、例数:读入数据,绘制饼形图来表达各类细菌的百分比关系。代码:dataBacterial;infile'C:MyRawDatabacterial.txt';inputBacterialClass$Number;run;*BarchartforBacterial;procgchartdata=Bacterial;pieBacterialClass/sumvar=NumberPERCENT=a
7、rraw;labelBacterialClass='细菌类别'Number='例数';title'400例细菌培养结果';run;运行结果:程序说明:(1)可选项“sumvar=Number”,指定变量Number为做统计计算的量(默认是FREQ);(2)可选项“PERCENT=arraw;”,指定按百分数显示,并连上线。(二)定量变量的图形一、直方图(Histogram),也称质量分布图对于定量变量(数值型变量),常用直方图来展示某个变量取值的分布,利用直方图可以估计总体的概率密度。将变量取值的范围分成若干区间。直方
8、图是用面积而不是用高度来表示数,总面积是100%.每个区间矩形的面积恰是落在该区间内的百分数(频率),所以矩形的高=频率/区间长度=密度特别地,若区间是等长的,则“矩形的高”就是频率。注意:直方图矩形之间是没有间隔的。用SGPLOT过程步绘制直方图以及密度曲线基本语法:PROCSGPLOTdata=数据集;HISTOGRAMvar
此文档下载收益归作者所有