多元统计分析与SPSS

多元统计分析与SPSS

ID:37747611

大小:1.69 MB

页数:71页

时间:2019-05-30

多元统计分析与SPSS_第1页
多元统计分析与SPSS_第2页
多元统计分析与SPSS_第3页
多元统计分析与SPSS_第4页
多元统计分析与SPSS_第5页
资源描述:

《多元统计分析与SPSS》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多元统计分析与SPSS实现一在SPSS中利用系统聚类法进行聚类分析二在SPSS中利用K均值法进行聚类分析三利用SPSS进行判别分析四利用SPSS进行主成分分析五利用SPSS进行因子分析设有20个土壤样品分别对5个变量的观测数据如表所示,试利用系统聚类法对其进行样品聚类分析。表5.16土壤样本的观测数据一在SPSS中利用系统聚类法进行聚类分析(一)操作步骤1.在SPSS窗口中选择Analyze→Classify→HierachicalCluster,调出系统聚类分析主界面,并将变量X1~X5移入Variables框中。在Cluster栏中选择Cases单选按钮,即

2、对样品进行聚类(若选择Variables,则对变量进行聚类)。在Display栏中选择Statistics和Plots复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。图系统聚类法主界面2.点击Statistics按钮,设置在结果输出窗口中给出的聚类分析统计量。这里我们选择系统默认值,点击Continue按钮,返回主界面。3.点击Plots按钮,设置结果输出窗口中给出的聚类分析统计图。选中Dendrogram复选框和Icicle栏中的None单选按钮,即只给出聚类树形图,而不给出冰柱图。单击Continue按钮,返回主界面。图Plots子对话框4.

3、点击Method按钮,设置系统聚类的方法选项。ClusterMethod下拉列表用于指定聚类的方法,包括组间连接法、组内连接法、最近距离法、最远距离法等;Measure栏用于选择对距离和相似性的测度方法;剩下的TransformValues和TransformMeasures栏用于选择对原始数据进行标准化的方法。这里我们仍然均沿用系统默认选项。单击Continue按钮,返回主界面。图Method子对话框5.点击Save按钮,指定保存在数据文件中的用于表明聚类结果的新变量。None表示不保存任何新变量;Singlesolution表示生成一个分类变量,在其后的矩形

4、框中输入要分成的类数;Rangeofsolutions表示生成多个分类变量。这里我们选择Rangeofsolutions,并在后面的两个矩形框中分别输入2和4,即生成三个新的分类变量,分别表明将样品分为2类、3类和4类时的聚类结果。点击Continue,返回主界面。图Save子对话框6.点击OK按钮,运行系统聚类过程。(二)主要运行结果解释1.在结果输出窗口中我们可以看到聚类树形图(Dendrogram)。从树形图5.12可以清楚地看到,若将20个样品分为两类,则样品2、6、19、7、和样品1为一类,其余的为另一类;若将样品分为三类,则样品8、9、4从第二类中分

5、离出来,自成一类;依此类推。图系统聚类法树形图2.由于我们已经在Save子对话框中设置了在数据文件中生成新的分类变量,所以,在数据编辑窗口中,我们可以看到生成的三个表示分类结果的新变量。变量名为clu4_1、clu3_1和clu2-1的三个分类变量分别表明了把样品分成4类、3类和2类的分类情况。图生成三个新的分类变量我国各地区2003年三次产业产值如表所示,试根据三次产业产值利用K均值法对我国31个省、自治区和直辖市进行聚类分析。二在SPSS中利用K均值法进行聚类分析(一)操作步骤1.在SPSS窗口中选择Analyze→Classify→K-MeansClust

6、er,调出K均值聚类分析主界面,并将变量—移入Variables框中,将标志变量Region移入LabelCaseby框中。在Method框中选择Iterateclassify,即使用K-means算法不断计算新的类中心,并替换旧的类中心(若选择Classifyonly,则根据初始类中心进行聚类,在聚类过程中不改变类中心)。K均值聚类分析主界面(一)操作步骤1、Analyze→Classify→K-MeansCluster,调出K均值聚类分析主界面。。。在NumberofCluster后面的矩形框中输入想要把样品聚成的类数,这里我们输入3,即将31个地区分为3类

7、。至于Centers按钮,则用于设置迭代的初始类中心。如果不手工设置,则系统会自动设置初始类中心,这里我们不作设置。K均值聚类分析主界面2.点击Iterate按钮,对迭代参数进行设置。MaximumIterations参数框用于设定K-means算法迭代的最大次数,ConvergenceCriterion参数框用于设定算法的收敛判据,其值应该介于0和1之间。例如判据设置为0.02,则当一次完整的迭代不能使任何一个类中心距离的变动与原始类中心距离的比小于2时,迭代停止。设置完这两个参数之后,只要在迭代的过程中先满足了其中的参数,则迭代过程就停止。这里我们选择系统默

8、认的标准。单击Conti

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。