sas学习(初识)

sas学习(初识)

ID:26295703

大小:288.09 KB

页数:12页

时间:2018-11-26

sas学习(初识)_第1页
sas学习(初识)_第2页
sas学习(初识)_第3页
sas学习(初识)_第4页
sas学习(初识)_第5页
资源描述:

《sas学习(初识)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、SAS学习笔记SAS学习笔记1自顶向下的设计,自底向上的运行2SAS程序由一个数据步datawork.filenam;.......run;若干执行步procprint.......run;procKEYword......run;可归纳为DATA步和PROC步两个部分。DATA步生产、整理数据报表编写,文件管理、信息检索等都在DATA中完成。PROC步分析数据管理数据、生成报告和图表及对数据排序等在PROC中完成。3SAS语句通常以SAS关键字开头,以分号(;)结束4SAS数据集是一个由SAS创建并且处理的文件,是一个包含数据值的特殊结构性文件。数据必须以SAS数据集的形式存在

2、才能用SAS程序和一些DATA步语句处理。12SAS学习笔记SAS数据集由描述信息部分,包括一般信息和变量信息用contents过程浏览proccontentsDATA=SAS-data-set;run;数据值部分是由字符或数字数据值组成的表格。用PRINT过程浏览procprintDATA=SAS-data-set;run;数据部分是一个由字符和/或数字数据值组成的矩形表格。变量名称是描述部分的一部分,而不属于数据部分。12SAS学习笔记5SAS逻辑厍是SAS文件的集合。就是一个目录。在使用中要通过一个引用名来识别。SAS逻辑库分临时库和永久库,名为的work是临时库,由SAS

3、自动创建,随着SAS会话的结束,其中的数据文件将被删除;永久库则会保存下来。当我们在磁盘上创建了一个文件目录并将使其做为SAS永久库时,需要使用LIBNAME语句分配一个逻辑库引用名libnamex_name‘s:workshop’;由此SAS建立了逻辑库(引用)名与操作系统上的文件目录的物理位置建立了连接。当SAS会话结束后,逻揖库引用名与文件的物理位置之间的走接就会切断。数据集是逻辑库中的一个SAS文件,在物理上是逻辑库对应的那个目录中的一个文件。表达为一个两级文件libref.filename如果libref被省略则默认为work。6用DATA语句创建临时或永久数据集SE

4、T语句读取数据文件或数据集12SAS学习笔记WHERE语句选择观测DORP或KEEP语句选择变量。对SAS数据集加工的一般格式:DATAoutput–SAS-data-set(生成数据集名);SETinput–SAS-data-set(读入数据集名);数据加工语;RUN;7DATA步数据处理的一般原理:step1,建立PDVPDV(programdatavector)程序数据向量,是SAS暂时存放数据的地方。当SET打开数据的时候,SAS将数据集中读入PDV中。PDV还包括根据DATA步中其它语句产生的新变量,以及两个系统变量_N_和_Error_step2,SET语句读入输入数

5、据集的描述部分step3,在PDV中加入变量①加入输入数据集的全部变;②加入DATA步中产生的新变量。step4,创建(目标)生成数据集的描述部分此时数据集为空,沒有记录(数据),数据的产生在DATA步执行阶段。step5,DATA步执行①PDV中变量初始化为缺失12SAS学习笔记②将输入数据集中的第一条记录读入PDV,并根据赋值语句计算PDV中新变量的值③将PDV中的数据写入在编译阶段创建好的生成数据集中,形成第一条记录④将输入数据集的第二条记录写入PDV,覆盖原有的内容,_N_的值置为2,覆盖过程中赋值语句将计算新变量,新变量在每次开始循环的时刻,被置为缺失⑤将PDV中数据

6、写入生成数据集中,形成生成数据集中的第二条记录。重复读入写出的过程,直到遇到读入数据集结束标志(EDF)。需要注意的几点:i,系统变量_N_和_Error_不能写入生成数据集,但赋值语句可以使用。ii,可以对读入PDV的变量或记录进行限制,但在不同的阶段进行限制,运行效率是不同的iii,当数据是从外部导入数据集时,则是先将外部数据读入输入缓冲区(Inputbuffer,然后由缓冲区写入PDV。每次循环开始时,PDV中的变量值被置为缺失,然后从缓冲读入原始数据。12SAS学习笔记图1DATA步工作流程8有关变量和记录限制的效率从一个SAS数据集中可以选择变量,并进行加工,进而生成新

7、的数据集,其中需要保留的变量用keepvariable-list;表示。需要删除的用dropvariable-list;表示。variable-list是指定需要保留或删除的变量列表。12SAS学习笔记从DATA的工作流程看,一是从读入到写入PDV之前进行控制,另一个是从PDV写入新数据集时进行控制,再有就是在整理数据过程中进行控制(见图2)。图2不同阶段的变量选择控制对于观测的约束同变量选择的一样,也在三个阶段进行控制,只是控制的方法更丰富了,一是在数据写入PDV之前,用SET

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。