资源描述:
《SAS语言体系讲解》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、SAS语言体系讲解2009-9-2420:50:16來源:itongji作者:itongjiSAS语言管窥感觉SAS语言体系是庞杂多于宏人。因为很多可以称得上宏人的语系例如微软系或者现在的Java系,多是先有一个比较周全的架构,通过有序的新生、继承和变异,逐渐扩展膨胀的,语言元素Z间有比较规范的关联。而SAS的语系虽有局部的架构,但就全局而言,主要是自发形成,也就是20多年的堆积和承袭。其实这也自然,SAS的应川领域靠近授终川户,模式千变万化,很难现有周全架构,只要有可行解就行了,而很多有纽•织的语系比较靠近系统底层,实际范畴比较集中,比较容易研究出架构。因此,
2、SASOR们的武艺和兵器往往是门派繁多,千变万化,但是很难冇那种18般兵刃样样精通的武林宗师(如果那位知道有,麻烦通知一下,我们好沐浴焚香去拜)。粗浅的印象是,SAS语系可以人致如F划分:1.国语:Base语系这是SASOR们不分阶级不分贫富都可以讲的话,里面就包含了常说的DataStep,ProcStep和MacrooSAS的基础语言元素主要是在这里演进而來。这个语言可以说是七十和八十年代面向过程处理语言的扛鼎Z作,甚至述带有浓郁的非结构化色彩;难得的是SAS公司作为偏重技术的私人公司,二卜多年以继承发展而非不断否定的方式打造Base,使得一些二十多岁“高龄”
3、的函数和过程历久弥新,在如今面向对象的强势群体中仍以面向过程的独特魅力占有一席Z地。DataStep为处理与数据存储引擎的交互提供了规范,可以处理大量复杂的数据操作和变量操作,DataStep的底层是用C语言开发的。而ProcStep的出现则具有两重含义,一是将一些常用的过程组合归整为固定的过程调用,在语言书写上或处理效率上起到提升作用;二是确定了今后很多SAS模块语言的规范,比如PROC的调用格式,CLASS,VAR,BY等语句,被广泛地应用在统让模块(如ProcReg),数据访问模块(如ProcDBLoad),多维模块(ProcMDDB),数据共享模块(如P
4、rocServer)以及很多GUI驱动的模块的shell命令(如EM中的ProcNeural)oProcStep用DataStep和C语言结合开发而成。Macro是Base中增强程序流程控制的语言机制。Macro并不是函数封装的概念,它的核心思路是文本替换,同操作系统shell脚本的机制相似。因此macro的执行是依据macro定义首先进行文本替换,得出最终程序语句后再解释执行。所以在内存分配中,并不像其它语言中那样形成函数调用堆栈。所以在Macro开发中,不能像函数调用那样实现调用现场退栈式的参数传递。虽然这种机制不像函数调丿IJ那样带來更多的编程灵活性,但是
5、由于文本替换不涉及复杂的内存分配管理,所以即使用很复杂的macro,替换的效率也很高,同时出现内存管理错误的概率也较小。由于Macro的设计含冇大量的非结构性元素,所以编程的流程管理要多加注意,否则很容易造成程序可读性旁的现象(事实上,看到%就想吐的现象是普遍存在的)。Base中有一个过程值得单独加以考察,就是ProcSQL。事实上,它实现了对SQL的兼容,给很多熟悉SQL的编程者多了一个选择。截至V8系列,ProcSQL使用的SQL是基于SQL92标准的SASSQL超集,有很多SAS特点的语法。关于同样的处理是使用SQL还是Data/ProcStep效率高的问
6、题可以另行讨论,简单的说,从设计思路上,SQL是基于集合的语言,而SAS是基于记录的语言;SAS的开发在SQL和Data/ProcStep上并不是协调一致的,在V6的SAS中,很多SQL操作明显比Data/ProcStep低效,在V8中,SQL有了明显改善,有些情况下会超过Data/ProcStep,但是也需具体情况具体分析,随着数据量的增长,ProcSQL不如Data/ProcStep内存管理稳定的现彖会渐渐明显,效率会冇较大差距;在V9开发中,SQL的势力进一步增强,提升幅度也会比以前大。Base语言的技能和思路是SAS的基本功,也是进入至高境界的重要途径。
7、对于初入江湖的少侠,Base语言像马步冲拳非连不可,而到了“手屮无剑,心屮有剑”境界的人侠,也往往只用SAS摆平一切,代码思路Z惊艳让人叹为观I上。2.官方语言:分析语系分析语系是以PROCSTEP架构扩展一些分析模块的语言,包括STAT,OR,QC,ETS,Insight和EM的shell过程,还有用于算法扩展的IML等。分析语言冇些贵族,因为盂要冇相应的背漿特別是统计背景的人才能讲好。换句话说,SAS的贵族气质,主要也是靠分析语言表达。经典统计语言STAT是名门望族的常用语,毎个过程都是多年的功力积累,所以即便是极为常见的过程,也是在性能、精度特别是边界条件
8、处理上表现出众,任何一个