欢迎来到天天文库
浏览记录
ID:15953408
大小:5.18 MB
页数:139页
时间:2018-08-06
《sas数据挖掘及应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、Sas数据挖掘139目录一:数据挖掘导论61:数据挖掘简介61.1数据挖掘的产生61.2数据挖掘概念62:数据挖掘原理72.1数据挖掘技术72.2数据挖掘过程83:数据挖掘应用93.1数据挖掘工具93.2数据挖掘应用场景10二:SAS数据挖掘基础111:SASEnterpriseMiner介绍111.1启动SASEM111.2建立工程和流程图131.3识别窗口组件182:SASEM挖掘过程193:SASEM结点介绍203.1抽样203.2探索203.3调整213.4模型223.5评估243.6在过程流程图中放置结点的一般规则26三:SAS数据管理261:数据读取261.1Procimport
2、语句261.2读取逗号分隔的文件281.3读取用tab键分隔的数据291.4读取excel301.5infile格式读取数据文件311.6:连接数据库322:数据预处理332.1数据清洗332.2数据集成332.3数据变换332.4数据归约342.5数据离散化343:数据导出343.1使用export过程343.2ods方式导出文件341394:SAS宏处理354.1第1步:写好程序,并且确保程序能够正确运行354.2第2步:使用宏变量帮助文本替换364.3第3步:使用宏函数将数据集的名称变成大写374.4第4步:从SAS数据集中创建宏变量384.5第5步:将程序放在在宏定义中394.6第6
3、步:在宏函数中使用参数404.7第7步:改变宏定义,为宏变量提供默认值424.8第8步:使用procsql创建宏变量434.9第9步:在宏定义中使用%if…%then%else语句执行条件语句444.10宏定义可以执行条件语句或者部分代码45四:SAS关联规则挖掘471:关联规则471.1起源471.2基本思想472:Apriori算法472.1算法原理482.2算法步骤482.3算法分析与改进503:SAS关联规则案例513.1问题背景513.2建立初始流程图513.3设置输入数据源结点513.4设置关联规则结点523.5理解和选择分析模式523.6在SASEM中计算一个项与其他项之间的关
4、联规则53五:SAS聚类分析551:聚类分析介绍551.1基本概念551.2算法概述561.3聚类应用572:kmeans算法582.1基本思想582.2算法步骤582.3算法分析603:层次聚类算法603.1基本思想603.2算法步骤614:SAS聚类分析案例674.1问题背景674.2聚类方法概述67六:SAS预测模型761:预测模型介绍761.1逻辑回归模型761391.2决策树模型761.3神经网络771.4逻辑回归基础772:逻辑回归示例782.1创建SASEM工程792.2添加输入数据源节点792.3添加数据划分节点802.4添加变量转换节点812.5运行回归模型节点,查看结果8
5、62.6创建模型提升图872.7部署模型883:sas决策树923.1问题背景923.2输入数据源923.3创建处理流程图933.6观察变量分布973.7修改变量信息973.8查看描述性统计信息983.9观察数据划分结点的默认设置993.10创建决策树1004:SAS神经网络案例1034.1建立流程图1044.2设置输入数据源1044.3设置数据划分节点1054.4构建多层感应器模型1054.5查看结果1084.6通过insight节点可视化模型1105:Hadoop下配置kmeans计算1135.1下载mahout1135.2解压缩mahout1135.3配置环境变量1135.4测试kme
6、ans算法1135.5kmeans聚类结果可视化显示115七:SAS可视化技术1201:SASgplot1201.1构建数据集1201.2绘制散点图1201.3添加标题和脚注1211.4使用goptions语句控制字体和高度1211.5改变标题的高度,右对齐脚注1211.6改变Y轴标签,包括内容和角度1211.7改变X轴和Y轴信息1221.8添加颜色信息1221.9改变坐标轴的颜色1221391.10添加另外一条线1231.11改变两条数据线的符号选项1231.12重新设置标题1231.13绘制多幅图1242:SASgchart1242.1柱状图:离散变量1242.2百分比图表1252.3汇
7、总图表1262.4改变柱状图的中点和顺序1262.5定义文本长度1262.6减少文本内容的大小1272.7在格式中使用分隔符1272.8增加柱状图的宽度1272.9使用水平柱状代替垂直柱状1282.10使用EMFDriver1282.11柱状图分组处理1292.12产生错误柱状图1302.13产生最大最小图1302.14产生3d图表1302.15直方图:连续变量1312.16环形图:pie,donut和星型图
此文档下载收益归作者所有