建立数据集课件.ppt

建立数据集课件.ppt

ID:57118261

大小:111.00 KB

页数:41页

时间:2020-07-31

建立数据集课件.ppt_第1页
建立数据集课件.ppt_第2页
建立数据集课件.ppt_第3页
建立数据集课件.ppt_第4页
建立数据集课件.ppt_第5页
资源描述:

《建立数据集课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章建立数据集SAS系统中建立数据集的途径主要有三种:●使用传统的SAS数据步程序●用SAS/FSP软件中的FSEDIT和FSVIEW过程●使用SAS/ACCESS软件访问其他的数据库1第三章建立数据集3.1利用数据步程序建立SAS数据3.1.1利用数据步创建SAS数据集的三种方式1.从程序中直接读入数据●DATA语句,启动一个数据步,命名数据集●INPUT语句,描述如何读入每一条记录(观测)●CARDS语句,提供要输入的数据2.将外部原始数据文件转换成SAS数据集●DATA语句,启动一个数据步,命名数据集●INFILE语句,指定存储有要读入数据的文件

2、●INPUT语句,描述如何读入每一条记录3.利用已有的数据集创建新的SAS数据集●DATA语句,启动一个数据步,命名数据集●SET/MERGE/UPDATE语句,连接/合并/修改已有的数据集2第三章建立数据集3.1.2常用数据步语句简介1.DATA语句语句格式:DATA<数据集名表>;DATA语句的作用是表明数据步的开始,并给出所建数据集的名称。所有的数据集名都是由半角符号“.”分隔的两部分组成。第1部分称作1级名(libname或库逻辑名),它标识数据集所存贮的位置;第2部分(2级名)标识特定的数据集。如:DATAA;则建立名为WORD.A的数据集(临

3、时)。3第三章建立数据集临时数据集:不指定1级名,使用WORK。空数据集:使用_NULL_数据集名,不建立数据集。DATA_NULL_;A=SIN(3.1415/4);B=INT(A*100);PUTAB;RUN;自动命名:不给出数据集名,则SAS自动以DATA1,DATA2等依次命名。DATA;当前数据集:最后建立的数据集。4第三章建立数据集DATAD1;INPUTAB;CARDS;3579;RUN;DATAD2;INPUTCD;CARDS;131517192123;RUN;PROCPRINT;RUN;PROCPRINTDATA=D1;RUN;5第三章

4、建立数据集2.INPUT语句用来描述在输入记录中的数据,并把输入值赋给相应的变量。语法:INPUT<变量列表>;Input语句中变量使用三种输入数据方式:列表输入列输入格式化输入6第三章建立数据集(1)列表输入在Input语句中,变量只简单列出变量名在数据中,数据由空格分隔。字符数据默认长度为8,若读入长数据,需用length语句。例:Inputname$agesex$S1S2S3;优点:简单易用。缺点:1)变量顺序必须与数据顺序一致。2)不能有选择的读入数据,只能按顺序输入。如:有ABCDE,如只想输入ABD,不能跳过C。3)不能输入带有空格的数据。注

5、意:缺项值用“.”表示。7第三章建立数据集(2)列输入在Input语句中,变量名后指出变量值所处的列号。在数据中,同一变量的数据应位于相同的列上。例:Inputname$1-8count10-12;cards;zhangsan101Lisi102优点:1)输入值可以以任何顺序读入:INPUTFIR73-80SEC10-12;2)字符型数据中可包含空格3)字符型数据可以最多到200个字符长4)可读取全部或部分数值:INPUTID10-15GROUP13;缺点:数据必须严格按照列位置输入。注意:所读取列中只有空格或“.”时,被作为缺项值。8第三章建立数据集(

6、3)格式化输入在Input语句中,变量名后给出一个输入格式。输入格式用来说明变量的数据类型和字段的宽度。在数据中,数据一般要求列对齐。例:INPUTNAME$10.H4.2;适合输入日期型数据:DATADAYS;INPUTNUM$BIRTHDAYMMDDYY8.TESTDAYDATE10.WT;CARDS;10017-21-963MAR9710100210/30/9614/JAN/974100306199613JUN19979100403079729AUG973;RUN;9第三章建立数据集注意:●格式化读入时,读数据指针按给出的格式长度移动。MMDDYY

7、8.格式读入日期值时,日期值最长占8列。如格式给出的长度不足,则会出现数据截尾。DATE10.格式是按ddmmmyy的格式读入数据的,最长可读入10列。●日期在SAS系统中的表示是用1960年1月1日至读入那一天之间的天数表示的。如读入的日期在1960年以前,则用负数表示。这种表示便于进行计算。●输出时一般要用相应的格式,详见8.(3)中FORMAT语句。●简化输入:如有X1,X2......X10十个字符型量的值紧挨在一起,每个量长度为3,则:INPUT(X1-X10)($3.);10第三章建立数据集(4)利用指针控制读数据的位置SAS中提供行指针和列

8、指针,用来指出下一输入位置。1)列指针控制:把指针移向你规定的列。格式:@n;@

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。