《创建数据集》ppt课件

《创建数据集》ppt课件

ID:40025009

大小:341.00 KB

页数:89页

时间:2019-07-17

《创建数据集》ppt课件_第1页
《创建数据集》ppt课件_第2页
《创建数据集》ppt课件_第3页
《创建数据集》ppt课件_第4页
《创建数据集》ppt课件_第5页
资源描述:

《《创建数据集》ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第6章创建数据集蔡德利TsaiDeli@sohu.com黑龙江八一农垦大学植物科技学院本章主要内容概述DataStep加工数据集PROCStep概述SAS对数据的管理通常,有两种:SAS数据集(dataset)SAS数据视图(dataview)概述概述SAS数据视图只有描述部分,没有数据部分,但描述部分包含了足够的信息以找到保存在其他文件中的数据;数据视图减少了维护费用。如果改变了源数据,数据视图将随着改变。可由SQL、ACCESS和DATAStep产生。概述Libname命令作用:指定库标记。一般格式:

2、Libname库标记’文件夹位置’选项;例如:指定目录“G:SAS统计分析SAS”为库标记MySASLibLibnameMySASLib’G:SAS统计分析SAS’;概述SAS语言是一种专用的数据管理、分析语言,它提供了很强的数据操作能力。表现在它可以轻易地读入任意复杂格式的输入数据,并可以对输入的数据进行计算、子集选择、更新、合并、拆分等操作。另外,SAS系统还提供了用来访问其它数据库系统如Sybase、Oracle的接口,访问各种微机用数据库文件如FoxPro、Excel的接口及向导,并提供了

3、一个SQL过程来实现数据库查询语言SQL的功能。概述SAS语言的自编程计算功能主要在数据步实现。一个SAS数据步相当于一个单独运行的程序。但是,SAS语言又是一个专用数据处理语言,所以SAS数据步有其他语言所没有的特点。概述例如/*SasProg0601.SAS*/dataa;putx=y=z=;inputxy;z=x+y;putx=y=z=;cards;1020100200;run;概述运行后在Log窗口显示…x=.y=.z=.x=10y=20z=30x=.y=.z=.x=100y=200z=300x=

4、.y=.z=.NOTE:ThedatasetWORK.Ahas2observationsand3variables.…概述程序的运行流程:1.DATA语句标志了数据步开始,并指定了数据步结束时要生成的数据集名字为A(实际是WORK.A)。2.第一个PUT语句要输出变量X、Y、Z的值,但它们还都没有定义,所以显示为三个缺失值。3.INPUT语句,从CARDS语句后面的数据行中读取变量X的值10,变量Y的值20。4.下一个赋值语句计算变量Z的值得到30。因此,LOG中的第二行输出显示三个变量的值分别为10、2

5、0、30。概述5.从CARDS语句开始到空分号行的各行是非执行的,程序运行到RUN语句,发现这是本数据步的最后一个语句,按一般的程序语言的规则,程序到这里就应该结束了,但是,SAS是一个专用数据处理语言,如果按一般语言的规则,程序中的第二行数据(100200)就不能被读入。所以,这个程序运行到RUN语句后,把读入的观测(这是第一号观测)写入输出数据集,6.流程又返回到DATA语句后的第一个可执行语句开始执行,并先把所有的变量置初值为缺失值。于是,第一个PUT语句的结果显示三个变量均为缺失值,而不是上一步的

6、10、20、30。概述7.INPUT语句又从数据行中读入下一个观测,把变量X、Y赋值为100、200。读取位置由运行时设置的一个数据指针指示。然后计算变量Z的值得300。于是PUT语句输出的X、Y、Z值分别为100、200、300。8.流程跳过CARDS语句到空语句,到数据步结尾,把第二号观测输出到数据集。9.再返回到数据步开头,把变量值赋初值为缺失值,所以第一个PUT语句输出的三个变量值为缺失值。10.运行到INPUT语句,应该读入下一个观测,但是查询数据指针发现已经读完了所有数据,所以本数据步结束,并

7、把两个观测写入数据集WORK.A中。概述从这个例子可以看出SAS数据步程序和普通程序的一个重大区别:SAS数据步如果有数据输入,比如用INPUT、SET、MERGE、UPDATE、MODIFY等语句读入数据,则数据步中隐含了一个循环。数据步因为有这样一个隐含循环,所以也提供了用来查询某一步是第几次循环的特殊变量_N_,它的值为数据步循环计数值。概述DataStep流程:概述DataStep第一种方式语法:DATA数据集名;Input变量列表;Cards;<数据区>;DATA、INPUT和CARDS三个关键

8、词缺一不可。注意:CARDS语句在INPUT语句之后DataStepDATA语句作用:标志数据步的开始。命名将要创建的SAS数据集。CARDS语句作用:用于直接输入数据,标志着数据块的开始DataStep直接输入SAS数据:/*SASProg0602.sas*/datatemp;inputxy@@;cards;345678903567891023657745;run;SAS默认按列来分隔变量,可是这里只有两个变量,输成两列数据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。