IBM SPSS Modeler 实验

IBM SPSS Modeler 实验

ID:40632799

大小:3.22 MB

页数:33页

时间:2019-08-05

IBM SPSS Modeler  实验_第1页
IBM SPSS Modeler  实验_第2页
IBM SPSS Modeler  实验_第3页
IBM SPSS Modeler  实验_第4页
IBM SPSS Modeler  实验_第5页
资源描述:

《IBM SPSS Modeler 实验》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、IBMSPSSModeler实验一、聚类分析在数据挖掘中,聚类分析关注的内容是一些相似的对象按照不同种类的度量构造成的群体。聚类分析的目标就是在相似的基础上对数据进行分类。IBMSPSSModeler提供了多种聚类分析模型,其中主要包括两种聚类分析,K-Mean聚类分析和Kohonen聚类分析,下面对各种聚类分析实验步骤进行详解。1、K-Means聚类分析实验首先进行K-Means聚类实验。(1)启动SPSSModeler14.2。选择“开始”“程序”“IBMSPSSModeler14.2”“IBMSPSSModeler14.2”,即可启动SPSSModeler程序,

2、如图1所示。图1启动SPSSModeler程序(2)打开数据文件。首先选择窗口底部节点选项板中的“源”选项卡,再点击“可变文件”节点,单击工作区的合适位置,即可将“可变文件”的源添加到流中,如图2所示。右键单击工作区的“可变文件”,选择“编辑”,打开如图3的编辑窗口,其中有许多选项可供选择,此处均选择默认设定。点击“文件”右侧的“”按钮,弹出文件选择对话框,选择安装路径下“Demos”文件夹中的“DRUG1n”文件,点击“打开”,如图4所示。单击“应用”,并点击“确定”按钮关闭编辑窗口。图2工作区中的“可变文件”节点图3“可变文件”节点编辑窗口图4文件选择对话框图5工作区中

3、的“表”节点(3)借助“表(Table)”节点查看数据。选中工作区的“DRUG1n”节点,并双击“输出”选项卡中的“表”节点,则“表”节点出现在工作区中,如图5所示。运行“表”节点(Ctrl+E或者右键运行),可以看到图6中有关病人用药的数据记录。该数据包含7个字段(序列、年龄(Age)、性别(Sex)、血压(BP)、胆固醇含量(Cholesterol)、钠含量(Na)、钾含量(K)、药类含量(Drug)),共200条信息记录。图6用于查看数据的“表”窗口图7工作区中的“类型”节点(4)使用“类型(Type)”节点选择聚类分析的字段。选中“DRUG1n”节点,在“字段选项”

4、选项卡中双击“类型”节点,则“类型”节点出现在工作区中,如图7所示。右键单击“类型”节点,选择“编辑”,可以看到一张关于字段的表,如图8所示。然后将所有字段的角色项设为“输入”,这表示要将所有字段进行聚类分析。最后点击“确定”按钮。图8“类型”节点编辑窗口(5)进行接入模型。首先,使用K-Means模型进行聚类分析。选择工作区的“类型”,在窗口底部“建模”选项卡中,找到“K-Means”模型,并双击。在工作区中,即得到一个K-Means模型节点,如图1-9所示。图9工作区中的“K-Means”模型(6)编辑K-Means节点。右键单击工作区的“K-Means”,选择“编辑”

5、,打开如图10的“K-Means”节点窗口。在“生成距离字段”的选择框中打勾,其他选择采用默认设置。点击“运行”按钮,即生成K-Means聚类分析。图10“K-Means”模型编辑窗口(7)查看K-Means聚类分析结果。在窗口右上侧区域的“模型”选项卡中,可以看到K-Means的模型,右键单击,并选择“浏览”,既可以看到K-Means聚类分析图,如图11所示。图11“K-Means”聚类分析图(8)分析K-Means聚类分析。从图11中可以看到,聚类分析将源数据分成了五个聚类,每个类占总数的比例分别为27.5%,23.0%,19.5%,15.5%和14.5%。其中,对分类

6、字段的依赖性依次由药类含量、血压、钾含量、胆固醇含量、钠含量、年龄和性别逐渐递减,其他的分析结论不在此细诉。至此,已经完成了K-Means聚类分析实验的全部步骤。2、“两步”聚类分析实验接下来,继续进行“两步聚类分析模型”的实验。(1)SPSSModeler中的“两步”聚类分析方法与K-Means聚类分析方法的前四步完全相同。(2)进行接入模型。首先,使用“两步”模型进行聚类分析。选中工作区的“类型”节点,在下面“建模”选项卡中,找到“两步”模型,并双击。在工作区中,即得到一个“两步”模型节点,如图12所示。图12工作区中的”两步”模型(3)同样,在此采用了默认的设置,因此

7、直接运行。运行完毕之后,就可以在窗口右上侧框中看到“两步”聚类分析模型,右键单击该模型,并选择“浏览”。即可得到如图13的聚类分析图。图13“两步”聚类分析图(4)从图13中可以发现,“两步”聚类分析得到的是三个类,分类预测字段的重要性也由药类含量、钾含量、血压、钠含量、性别、年龄和胆固醇含量逐渐递减。3、Kohonen聚类分析实验Kohonen聚类分析实验的步骤也比较简单。(1)前四步同K-Means聚类分析完全相同,即完成数据的导入、生成类型节点等步骤。(2)进行接入模型。选中工作区的“类型”节点,在下面“建模

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。