欢迎来到天天文库
浏览记录
ID:50551923
大小:241.00 KB
页数:20页
时间:2020-03-10
《SAS课件——第14讲 SAS过程步常用语句.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、SAS过程步常用语句proc语句by语句class语句var语句weight语句freq语句id语句output语句title语句options语句where语句format语句label语句1SAS过程步的一般形式PROC<过程名>[DATA=<输入数据集>][<选项>];<过程语句>/<选项>;<过程语句>/<选项>;RUN;2PROC语句语句格式:procsas过程名<选项>;功能:指定所需调用的过程,以及该过程的若干选择项。选项类型:(1)关键字规定反映本过程特征(2)关键字=值规定参数值(3)关键字=sas数据集名设定输入输出3
2、例1:PRINT过程,显示数据集a的内容,用标签内容代替变量名:procprintdata=alabel;例2:means过程,计算数据集b中指定变量的观测个数、均值和总和:procmeansdata=bnmeansum;4BY语句by语句指定用于分组的变量(不同于class语句所指定的分组变量),以便按照该变量的水平(或多个by变量的水平组合)将输入数据集分割成多个子数据集,从而在各个子数据集内分别执行相应的分析过程。使用by语句时,相应的SAS过程要求输入数据集已经按照by语句定义的变量进行排序,by语句中指定的变量必须为输入数据集中
3、的一个或多个变量,可为数值型和字符型。如果输入数据集事先并未按照by语句定义的变量进行排序,我们可通过以下三种方法进行处理:(1)使用sort过程;(2)在by语句中设置选项:“notsorted”或“descending”,“notsorted”表示数据未按照by变量进行任何排序。若数据集事先按照by变量进行了升序排列,则不要设置选项;若进行了降序排列,则应该在变量名之前用“descending”。5例1:下面的程序对数据集按sex变量值升序排列,并在同一组内按h降序排列,并按sex变量分组显示。libnameel‘e:saslx’;
4、procsortdata=el.studentsout=el.sortstud;bysexdescendingh;run;procprintdata=el.sortstud;bysex;run;6Class语句class语句用于指定数据分析中的分组变量,每一个class变量的水平(变量值)或多个class变量的每个水平组合定义一个分组,有关全体样本和个分组内样本的相应统计量均会被计算并显示。对means过程的一次调用中可使用多个class语句,此时等同于在一个class语句中指定了全部的class变量。7Var语句var语句用于指定所要分
5、析的变量,分析变量在该语句中的排列位置决定了其在输出结果中的排列位置。它的一般形式为:var变量1变量2…;8例2:下面语句按sex值分组对VAR所标识的变量进行分析,产生两个单独的描述性统计报告。procmeansdata=sasuser.class;bysex;varweightheight;run;9weight语句若资料已经分组,编成了变量序列,在这组数据中,各个变量值在总结果中所占的百分比称为这个变量的权重。数据的权重反映了该变量在总体中的相对重要性每种变量的权重的确定与一定的理论经验或变量在总体中的比重有关。权重的取值在不同的
6、数据分析中方法不同。语句格式:Weight变量;功能:在过程中规定一个数值变量,并以它的值作为观测的相关权重。权重值可以为大于0的数。10freq语句freq语句指定用以作为观测频数的变量,freq变量须为数值型变量。如果freq变量值为非整数,则其小数部分被截去,如果其变量值小于1或为缺失值,相应观测将不被用在计算统计量的过程中。统计量中的观测总数将等于freq变量值的合计。11id语句id语句指定在输出结果或输出数据集中作为行标识的变量。在输出结果或输出数据集中,行(每个分组占一行)的标识以该组中id变量的最大值来表示。如果在proc
7、means语句中设置“idmin”选项,则各分组中id变量的最小值将被作为行表示来使用。12output语句output语句的功能是将分析所得的各类统计量存储到指定名称的输出数据集中。13title语句141516options语句Options语句的格式:Optionsoption…;Options语句将改变SAS系统的默认设置。由于它所做的改变在SAS运行期间一直起作用。17where语句18format语句19label语句20
此文档下载收益归作者所有