第8章聚类分析

第8章聚类分析

ID:46245410

大小:326.36 KB

页数:19页

时间:2019-11-22

第8章聚类分析_第1页
第8章聚类分析_第2页
第8章聚类分析_第3页
第8章聚类分析_第4页
第8章聚类分析_第5页
资源描述:

《第8章聚类分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第8章聚类分析在自然与社会科学研究屮,存在着人量分类研究的问题,如病虫害种群消长演替规律的研究中,需要从生态系统出发,构造其数最、时间和空间关系的分类模式,以此来研究病虫害的发生规律。聚类分析就是其分类研究的方法Z—。聚类分析是根据事物本身的特性研究个体分类的方法。聚类分析的原则是同一类屮的个体有较大的相似性,不同类屮的个体差异很大。根据分类对象的不同可分为样品聚类和变量聚类。1)样品聚类样品聚类在统计学中又称为Q型聚类。用SPSS的术语来说就是对事件(Cases)进行聚类,或是说对观测量进行聚类。是根据被

2、观测的对象的各种特征,即反映被观测对象的特征的各变量值进行分类。2)变量聚类变量聚类在统计学乂称为R型聚类。反映同一事物特点的变量有很多,我们往往根据所研究的问题选择部分变量对事物的菜一方面进行研究。由于人类对客观事物的认识是冇限的,往往难以找出彼此独立的冇代表性的变量,而影响对问题的进一步认识和研究。例如在回归分析中,由于自变量的共线性导致偏回归系数不能真正反映自变量对因变量的影响等。因此往往先要进行变量聚类,找出彼此独立R冇代表性的自变量,而又不丢失大部分信息。8.1快速聚类过程(K-MeansClus

3、ter)调用此过程可完成由用户指定类别数的人样本资料的逐步聚类分析。所谓逐步聚类分析就是先把被聚对象进行初始分类,然后逐步调整,得到最终分类。[例子8-1]根据1962年至1988年积累的三化螟有关资料进行聚类分析,研究三化螟种群消长规律。数据见表8-1,其中发生期是指卵盛孵高峰期(2代以5月31日和3代7月20日为零计算天数),F2-F3为2代至3代的增殖系数,F3-F4为3代至4代的增殖系数。对幼虫发生虽和发生期数据进行快速聚类,分析各年的发生程度。表8・1年份幼虫发生量发生期増殖系数第2代第3代第2代

4、第3代F2-F3F3-F4196234433332999.691.9119631211497271912.371.341964187181332189.701.06196550040003414&001.821966441375036148.501.8719674044600331611.391.52196832898635183.011.261969806179032152.222.141970730197036202.702.64197126333329151.271.07197248660032191

5、.231.47197324858533202.361.0819742100270022141.281.3319753332873819.86.70197690774024.861.871977192540271.322.8819782302525392010.96.551979139210413318.754.171980308413128.133.34198141591636182.211.09198234401382911.79.99198326780337263.01.0919841043350039

6、263.36.0719852243745231203.32.12198623659935262.54.001987558106133241.90.001988162281734212.64.008.1.1操作方法1)数据准备在数据管理窗口,定义变量名:年份、幼虫2、幼虫3、发生期2、发生期3、增殖23、增殖34,分别代表年份、第2代幼虫发生量、笫3代幼虫发生量、笫2代发生期、第3代发生期、F2-F3增殖系数、F3-F4增殖系数。其中年份变量为字符变虽:,其它为数值变量。然后输入原始数据。数据保存在配套光盘中

7、(SPSSDATADATA8-2.SAV)。2)启动快速聚类过程在SPSS主菜单中按“Analyze-*Classify-*K-MeansCluster”顺序逐一单击鼠标键,打开快速聚类主对话框,如图8-1所示。图8-1快速聚类主对话框3)指定分析变量和标识变量选择参与聚类分析的数值型变量,在变量列表中选中变量后,单击“Variables"矩形框左边的右拉箭头按钮,使选中的变量名移到右血的"Variables”矩形框中。本例题耍求根据“幼虫2”、“幼虫3”、“发生期2”和“发生期3”进行聚类。因此选择

8、这4个变量并移至“Variables”矩形框中。本例子中标识毎个观测量的变量是年份。因此,选择主对话框中左面变量表中的“年份”,单击鼠标键使之选屮。单击右拉箭头按钮,使变量名移到"LabelCasesby:”框中。4)确定分类数系统默认的分类数为2,显示在“NumberofClusters"框中。按发生程度轻、中、重,应该分为3类,将原数值2改为3。5)选择聚类方法在主对话框屮的“Method”栏中的两项屮可以选

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。