欢迎来到天天文库
浏览记录
ID:6823449
大小:325.00 KB
页数:12页
时间:2018-01-27
《sas系统和数据分析sas数据集的编辑》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、0536c7b54bc10165bf416ce651b9a1e7.docSAS系统和数据分析电子商务系列第十一课SAS数据集的编辑通常从外部数据源转换得到SAS数据集后,并不是所有的数据集都满足统计数据要求,可立即调用统计过程进行统计分析。需要对数据集进行满足统计数据要求的编辑或生成新的数据集。一、增加数据集一个新变量SAS系统可通过赋值语句把包含操作符的表达式赋值给数据集所要创建的新变量。SAS的表达式中还可以包含SAS函数,如一些常用的SAS函数见下表:函数分类常用函数功能数学运算函数ABS()取绝对值SQRT()求平方根INT()取整数
2、部分EXP()计数e的次幂LOG()求e为底的自然对数SIN()计算正弦LAGn()求给定变量滞后为n的值统计计算函数MAX()求最大值MIN()求最小值MEAN()求平均值SUM()求和DIFn()求给定变量X的第n阶差STD()求标准差PROBNORM()标准正态分布函数日期时间处理函数DATE()/TODAY()取当日的日期值DAY()计算某月的那一日HOUR()计算小时TIME()取当日的时间YEAR()取年值字符函数INDEX()搜寻字符串的位置LEFT()字符串表达式左对齐SUBSTR()抽取子字符串TRIM()移走尾部空格LEN
3、GTH()给出字符变量的长度UPCASE()转换为大写财政金融函数COMPOUND()计算复利IRR()计算内部赢利率上海财经大学经济信息管理系IS/SHUFECreatedbyzxdeng@mail.shufe.edu.cnPage12of120536c7b54bc10165bf416ce651b9a1e7.docSAS系统和数据分析电子商务系列NPV()计算净现值SAVING()计算定期储蓄的本金和利息例如,有一个学生成绩数据集中的数据来源写在CARDS语句后,但我们还需产生新的变量平均分和总分,数据步的程序如下:Dataclass2;I
4、nputidtest1-test5;average=mean(test1,test2,test3,test4,test5);total=test1+test2+test3+test4+test5;Cards;1001001001001009010090100908182838485Procprintdata=class2;Run;在OUTPUT窗口中显示的运行结果见图11.1所示。图11.1用赋值表达式创建数据集的新变量一、选择数据集的变量和观测数据库的三种基本操作是选择、投影和连接,如果我们把数据库看成是一张表格,选择和投影操作相当于从一张
5、大的数据库表格中挑选所需的行和列形成一张小的数据库表格。连接操作相当于把两张或两张以上的数据库表格按某种规则合并成一张数据库表格。原始数据库表格可以是外部数据文件(用INFILE语句输入),或在作业流中(用CARDS语句输入),或来自其他SAS数据集(用SET语句输入)。上海财经大学经济信息管理系IS/SHUFECreatedbyzxdeng@mail.shufe.edu.cnPage12of120536c7b54bc10165bf416ce651b9a1e7.docSAS系统和数据分析电子商务系列1.选择变量(即选择列)使用DATA语句的D
6、ROP=和KEEP=选项可以控制从原始数据库中读出的变量是否被写入将要创建的数据集。例如,假设我们要从CLASS2数据集中产生只包含ID、AVERAGE和TOTAL变量,而不包含TEST1、TEST2、TEST3、TEST4、TEST5变量的新数据集CLASS3。有两种程序编法都能达到相同的目的,一是使用DATA语句的DROP=选项,表示从原有变量中去掉DROP=中指明的变量;二是使用DATA语句的KEEP=选项,表示从原有变量中只保留KEEP=中指明的变量。程序如下:程序一:Dataclass3(drop=test1test2test3te
7、st4test5);Setclass2;Procprintdata=class3;Run;程序二:Dataclass3(keep=idaveragetotal);Setclass2;Procprintdata=class3;Run;程序一和程序二的运行结果相同。在OUTPUT窗口中显示的运行结果如图11.2所示。图11.2对数据集用DROP或KEEP进行变量选择上海财经大学经济信息管理系IS/SHUFECreatedbyzxdeng@mail.shufe.edu.cnPage12of120536c7b54bc10165bf416ce651b9
8、a1e7.docSAS系统和数据分析电子商务系列1.选择观测(即选择行)选择满足条件的记录行来形成新的数据集,可使用DATA步的IF语句,IF语句的作用就像一个过滤
此文档下载收益归作者所有