SAS实战内部培训讲解.pdf

SAS实战内部培训讲解.pdf

ID:52111833

大小:657.24 KB

页数:10页

时间:2020-03-22

SAS实战内部培训讲解.pdf_第1页
SAS实战内部培训讲解.pdf_第2页
SAS实战内部培训讲解.pdf_第3页
SAS实战内部培训讲解.pdf_第4页
SAS实战内部培训讲解.pdf_第5页
资源描述:

《SAS实战内部培训讲解.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、SAS入门培训资料(内部使用)一、简要说明1.关于SASSAS是专业统计分析工具,由于其编程的功能使很多人望而却步,但是对于感兴趣的人来说,只要坚持学习,都会有收获。2.关于数据处理SAS能处理近千万条数据,对于互联网行业来说,这些都是日常性的工作,一般的数据处理工具象EXCEL只能处理6万多条数据,很难满足分析人员的需要,SPSS由于其响应速度的缓慢,虽然处理数据比EXCEL多4个数量级(约50万),但是仍不是分析人员的首选。3.关于数据分析数据分析员首先要懂得这样一个道理:分析的首要因素不是工具(SAS,SPSS,EXCELL),也不

2、是方法(简单统计方法,高级统计方法,人工智能方法),而是理念(IDEA),更具体说是思路(WAY),这不是人人都能理解的道理,但是在明确分析的思路以后,工具和方法随之就会摆在分析人员面前,所以学会工具乃是进行下一步分析的必要条件。4.关于分析思路以下是我总结的一般数据分析的思路,以流程图展示:上图每个表格中的黑体字表示流程步骤,首先是主题需求,即我们要分析的主题是什么,这个一般是决策者关心的问题,我们需要把决策者关系的问题给它具体化。然后是影响因素,影响因素是针对主题需求而设计的定性变量集合。接着就是数据的获取了,数据的获取是根据影响因素

3、去寻找相应的数据,这些数据源可能存放在不同的地方,需要我们用各种方法去获取这些数据源(如从EXCEL,数据库等)。接着是数据导出和数据导入,这两个步骤是针对SAS工具而言的,在EXCEL里面不需要。数据导入到SAS之后,不能立刻进行分析,而是需要对数据进行清洗,这个过程是很复杂的,也有专业的工具来做这件事情(如CLEMENTINE),这里我们不做详细的分析。接下来就是数据的分析了,分析就需要涉及到方法,有简单的统计方法,也有高级的统计方法,所有的方法都是围绕主题来进行的。最后对于出来的结果用报告的形式发布。二、实例操作过程安装好特别版SA

4、S9.0之后,运行EXE文件,我们会看到如下图:逻辑库,存放数据日志窗文件口,随时记录程序运行结果程序窗口,编程实现地上面打箭头的三个地方是分析的时候必须用到的,其它的在此不再一一说明,请自行操作感受一下。下面我们针对userstatus2表进行实战演习,思路如下:1.主题需求:分析上半年主站北京和讯和鸿联1518两个通道的用户流失情况,因为这两个通道上半年一直在用,其它的通道都是非连续使用,在此不研究。2.影响因素:影响用户流失的可能因素有:产品(性福、影视、动漫);地区(不同地区由于经济发展水平和人的素质等因素不同也会影响用户流失),

5、其它的因素肯定还有,比如用户年龄结构,教育程度等,但是由于我们无法获取这些信息,只能放弃。3.数据获取:用SAS程序获取userstatus2对应字段数据。4.数据导入与导出:有两种方法,在此介绍用EXCEL导入,详见下面的专题介绍。数据整理:对形成的六个数据集(六个月)进行整合,形成一张SAS数据表。5.数据分析:本文用频率分析、列链表分析完成,其它的数据挖掘方法(如WEB图、决策树等)是用CLEMENTINE实现的,在此不做介绍了。6.结果呈现:大家就用WORD好了。这是个通用的软件。专题介绍:1.关于数据获取第一种方法:直接用SAS

6、连接数据库,此法我试验过,对10万条记录的数据响应时间大约是28秒,如果大家猴急猴急的,这个可能有点慢了,要是数据更多,那这个方法你肯定不喜欢了,但是我还是要把对应的程序告诉大家:首先要去控制面板做一个ODBC数据源,如我们现在要想获取218.1.74.238服务器上的数据库VOD_STAT里面的表filmstat的数据(当然啦,你首先要和管理员联系你有没有访问的权限),去控制面板,打开管理工具下面的数据源选项,添加一个数据源,这个流程就不做介绍了,大家可以自己去做。最后我们添加好的数据源的名称是VOD_STAT。回到SAS,在程序窗口输

7、入如下程序:Libnamefeiyun'f:';procsql;Connecttoodbc(dsn='VOD_STAT'uid='bbvodzfy'pwd='zfybbvod!@#!');Createtablefeiyun.chaoasSelect*fromconnectiontoodbc(selecttop10*fromfilmstat);quit;程序详解:第一句:libnametry'f:';这句话告诉SAS,我们要建立一个SAS数据库了,名字叫feiyun,数据库里面的文件放在F盘根目录下面,当然啦,这里的数据库名字和目录你都

8、可以更改的。比如我想放在F盘的下一级目录sas里面,那么就用这个语句:libnamefeiyun'f:sas';简单吧?要注意的是,这里的分号”;”千万不能丢!SAS语句都是以分号结尾的。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。