聚类分析实验讲义.doc

聚类分析实验讲义.doc

ID:51388569

大小:288.50 KB

页数:8页

时间:2020-03-23

聚类分析实验讲义.doc_第1页
聚类分析实验讲义.doc_第2页
聚类分析实验讲义.doc_第3页
聚类分析实验讲义.doc_第4页
聚类分析实验讲义.doc_第5页
资源描述:

《聚类分析实验讲义.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实验项目五聚类分析—、实验内容、目标及要求(一)实验内容聚类分析是一种研究事物分类的方法,其忖的是把分类对象按一定的规则分为若干类,这些类不是事先给定的,而是根据数据的特征确定的。通俗的讲,聚类分析法是用来对资料做简化的工作及分类,也就是把相似的个体(观察量)归于一群。例如汽车制造商可以通过聚类分析确定目前市场中竞争产品是哪些。下面从SPSS白带数据car_sales.sav(SPSS/tutorial/sample)中选择数据进行分析。(-)实验目标SPSS软件屮系统聚类法和K均值聚类的计算机操作及结果分析。(三)实验要求要求学生能熟练应川计算机

2、软件进行聚类分析,并对结果进行分析,培养实际应用能力。二、实验准备(一)运行环境说明电脑操作系统为WindowsXP,所需软件为SPSS16.()0(二)基础数据设置说明将数据正确导入SPSS,设置相应的变杲值。三、实验基本操作流程及说明(一)系统界面及说明同实验一。(二)操作步骤1.选择菜单项Analyze-^Classify-^HierachicalCluster,打开HierachicalClusterAnalysis对话框,如错误!未找到引用源。。将原始变量Priceinthousands到Fuelefficiency移入Variables

3、列表框框屮,将标‘忐变量Model移入LabelCaseby列表框框屮。HierarchicalClusterAnalysis国Manufacturer[maniASalesinthousands》4-yearresalevalue影Vehicletype[type]Log-lran$formedsal^>Z$core:4-yearrese^Zscore:Type[ztyp«Zscore:Priceinthe■^>Zscore:Enginesize^>Z$core:Hor$epow(^>Z$core:Wheelbase•^>Zscore:Width

4、[zwi«▼IOHB■_一....Variable(s):靠Priceinthousands£Enginesize[engine_

5、妙Horsepower[horse後Wheelbase[wheell.〈4WidFhfiAiidthlJZjLabelCasesby:

6、[A>Model[model]ClusterQCases「VariablesMBDisplayVStatisticsVPlolsOKPasteResetCancelHelpSlatistics...Pig…

7、Method…

8、S^ve...图5-1HierachicalClusterAn

9、alysis对话框在Cluster栏屮选择Cases单选按钮,对样品进行聚类(若选择Variables,则对变量进行聚类)。在Display栏屮选择Statistics和Plots复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。2.点击Plots按钮,打开Plots了对话框,如图5・5。设置结果输出窗口中给出的聚类分析统计图。Dendrogram为聚类树形图‘Icicle为冰柱图。图5-2Plots子对话框这里我们选屮Dendrogram复选框和Icicle栏中的None单选按钮,貝输出比较常用的聚类树形图,而不给出冰柱图。3.点击

10、Method按钮,打开Method子对话框,如图5—6,设置系统聚类的方法选项。图5-3Method子对话框ClusterMethod下拉列表用于指定类与类Z问距离的测度方法,具体选项的含义参见教材。Measure栏用于设置不同数据类型下的个体与个体Z间距离的测度方法,其Interval屮的方法适用于连续型变最,Counts屮的方法适用于计数变量,Binary屮的方法适用于二值变量。TransformValues选项栏用于当原始数据不是同一数量级别的时候选择对原始数据进行标准化的方法。单选按钮Byvariable表示针对变量进行标准化,适用于Q型聚

11、类;Bycase表示针对观测进行标准化,适用于R型聚类。这里我们选择最为常用的Z分数标准化法对原始数据进行标准化,其余选项均保持默认。4.点击Save按钮,打开SaveNewVariablesT对话框,指定保存在数据文件屮的用于表明聚类结果的新变量。None表示不保存任何新变量;Singlesolution表示生成一个分类变量,在其后的矩形框屮输入要分成的类数;Rangeofsolutions表示生成多个分类变最。这里我们选择Rangeofsolutions,并在后面的两个矩形框屮分别输入2和4,即生成三个新的分类变量,分别表明将样品分为2类、3类

12、和4类时的聚类结果。5.在主对话框中点击0K按钮,运行系统聚类过程,结果如表5—1和图5—7所示。表5・1聚类过程表Sta

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。