聚类分析实验讲义

聚类分析实验讲义

ID:46254064

大小:112.68 KB

页数:8页

时间:2019-11-22

聚类分析实验讲义_第1页
聚类分析实验讲义_第2页
聚类分析实验讲义_第3页
聚类分析实验讲义_第4页
聚类分析实验讲义_第5页
资源描述:

《聚类分析实验讲义》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实验项目五聚类分析一、实验内容、目标及要求(一)实验内容聚类分析是一种研究事物分类的方法,其目的是把分类对象按一定的规则分为若干类,这些类不是事先给定的,而是根据数据的特征确定的。通俗的讲,聚类分析法是用来对资料做简化的工作及分类,也就是把相似的个体(观察屋)归于一群。例如汽车制造商可以通过聚类分析确定目前市场中竞争产品是哪些。下面从SPSS自带数据car_sales.sav(SPSS/tutorial/sample)中选择数据进行分析。(二)实验目标SPSS软件中系统聚类法和K均值聚类的计算机操作及结呆分析。(三)

2、实验要求要求学生能熟练应用计算机软件进行聚类分析,并对结果进行分析,培养实际应用能力。二、实验准备(一)运行环境说明电脑操作系统为WindowsXP,所需软件为SPSS16.0。(二)基础数据设置说明将数据正确导入SPSS,设置和应的变量值。三、实验基本操作流程及说明(一)系统界面及说明同实验一。(二)操作步骤1.选择菜单项AnalyzefClassifyfHierachicalCluster,打开HierachicalClusterAnalysis对话框,如错误!未找到引用源。。将原始变量Priceinthousa

3、nds到Fuelefficiency移入Variables列表框框屮,将标志变最Model移入LabelCaseby列表框框中。:HierarchicalClusterAnalysis■.^>Z$core:4-yearre$<^>Zscore:Type[ztyi<^>Zscore:PriceintF•^>Zscore:Engine$iz(Zscore:Horsepow(■,^>Z$core:Wheelbase<^>Zscore:Width[zwnj▲Variable(s):OK初Priceinthousands占I~

4、~]紗Enginesize[engine1I1影Horsepower[horseResetI®Wheelbase[wheell.—WidrhfiAiidihi二1Cancel

5、aLabelCasesby:Help141

6、舛Model[model]国Manufacturer[mam⑥Salesinthousands®4-yearresalevalue^Vehicletype[type]ClusterGCases「VariablesDisplayVStatisticsPPlotsPlots..・Method...ISav

7、e...图5-1HierachicalClusterAnalysis对话框在Cluster栏小选择Cases单选按钮,对样品进行聚类(若选择Variables,则对变量进行聚类)。在Display栏屮选择Statistics和Plots复选框,这样在结果输出窗口屮可以同时得到聚类结果统计量和统计图。2.点击Plots按钮,打开Plots子对话框,如图5・5。设置结果输出窗口中给出的聚类分析统计图。Dendrogram为聚类树形图,Icicle为冰柱图。图5-2Plots子对话框这里我们选中Dendrogram复选框和

8、Icicle栏中的None单选按钮,只输出比较常用的聚类树形图,而不给出冰柱图。3.点击Method按钮,打开Method子对话框,如图5—6,设置系统聚类的方法选项。图5-3Method子对话框ClusterMethodH拉列表用于指定类与类Z间距离的测度方法,具体选项的含义参见教材。Measure栏用于设置不同数据类型下的个体与个体Z间距离的测度方法,其Interval中的方法适用于连续型变量,Counts中的方法适用于计数变量,Binary中的方法适用于二值变量。TransformValues选项栏用于当原始数

9、据不是同一数量级别的时候选择对原始数据进行标准化的方法。单选按钮Byvariable表示针对变最进行标准化,适用于Q型聚类;Bycase表示针对观测进行标准化,适用于R型聚类。这里我们选择最为常用的Z分数标准化法对原始数据进行标准化,其余选项均保持默认。1.点击Save按钮,打开SaveNewVariables子对话框,指定保存在数据文件屮的用于表明聚类结果的新变量。None表示不保存任何新变量;Singlesolution表示生成一个分类变量,在其后的矩形框中输入要分成的类数;Rangeofsolutions表示生

10、成多个分类变量。这里我们选择Rangeofsolutions,并在后面的两个矩形框中分别输入2和4,即生成三个新的分类变屋,分别表明将样品分为2类、3类和4类时的聚类结果。2.在主对话框屮点击0K按钮,运行系统聚类过程,结果如表5—1和图5-7所示。表5-1聚类过程表StageClusterCombinedCoefficientsStageCl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。