多元统计分析实验报告_聚类分析

多元统计分析实验报告_聚类分析

ID:2268234

大小:51.00 KB

页数:8页

时间:2017-11-15

多元统计分析实验报告_聚类分析_第1页
多元统计分析实验报告_聚类分析_第2页
多元统计分析实验报告_聚类分析_第3页
多元统计分析实验报告_聚类分析_第4页
多元统计分析实验报告_聚类分析_第5页
资源描述:

《多元统计分析实验报告_聚类分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、武汉理工大学实验(实训)报告项目名称实验2―聚类分析所属课程名称多元统计分析项目类型设计性实验实验(实训)日期年月日班级学号姓名指导教师武汉理工大学统计学系制一、实验(实训)概述:【目的及要求】聚类分析的目的是将分类对象按一定规则分为若干类,这些类不是事先给定的,而是根据数据的特征确定的。在同一类里的这些对象在某种意义上倾向于彼此相似,而在不同的类里的对象倾向于不相似。按具体的题目要求完成实验报告,并及时上传到给定的FTP和课程网站!【基本原理】系统聚类法是聚类分析中用的最多的一种,其基本思想是:开

2、始将n个对象各自作为一类,并规定对象之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其它类之间的距离;重复进行两个最近类的合并,每次减少一类,直至所有的对象合并为一类。【实施环境】(使用的材料、设备、软件)SPSS等软件二、实验(实训)内容:【项目内容】聚类分析。【方案设计】共含两道题目:第一题为基于距离矩阵的聚类分析;第二题为基于原始数据的聚类分析。三、指导教师评语及成绩:评语:成绩:指导教师签名:批阅日期:实验报告2聚类分析(设计性实验)实验原理:聚类分析的目的是将分

3、类对象按一定规则分为若干类,这些类不是事先给定的,而是根据数据的特征确定的。在同一类里的这些对象在某种意义上倾向于彼此相似,而在不同的类里的对象倾向于不相似。系统聚类法是聚类分析中用的最多的一种,其基本思想是:开始将n个对象各自作为一类,并规定对象之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其它类之间的距离;重复进行两个最近类的合并,每次减少一类,直至所有的对象合并为一类。实验题目一:为了对11种语言——英语、挪威语、丹麦语、荷兰语、德语、法语、西班牙语、意大利语、波

4、兰语、匈牙利语及芬兰语进行比较研究,研究人员选取每种语言的1至10十个数字相应的单词列表分析。对于同一数字,某两种语言的第一个字母若相同,则称这两者在该数字上一致,否则非一致。将这11种语言两两比较后,计算每一对在十个数字上非一致的数目,得到下列距离矩阵:ENDaDuGFrSpIPHFiE0N20Da210Du7560G64550Fr666970Sp6659720I66597110P7761085340H98889101010100Fi99999999980(1)对这11种语言分别用最小距离法(si

5、nglelinkage)、最大距离法(completelinkage)、平均距离法(averagelinkage)进行聚类分析;(2)画出以上三种方法聚类分析结果的树状图;(3)结合三种方法的树状图,你认为将11种语言分为哪几类比较合适?(4)用最大距离法将11种语言聚为3类,并将聚类结果存储在一个SPSS数据文件中。实验题目二:下表给出了2010年湖北省省各地区的人均各项消费支出情况。表-1:2010年湖北省各地区人均各项消费支出市(县)(代码)食品类(元)衣着类(元)家庭设备(元)医疗保健(元)

6、交通和通(元)娱乐教育(元)居住(元)服务项目(元)42013303645626.5444.1547.51079701442.942022985608845.1537590.51028706.7334.1420327445543806074968275823504204284362352945342466241440542053033527851.1317.5403.21347612.9338420628853947484164511063746261420732516325424406759378

7、543694208286450084158870992131438242093561566953.1463.1887.4967722.3434.3421026496671798372.3650.2844768.4541.74211243741013996714576348602234212237249779349340777443638942132200567708.6500.4781790.8606.5262.7实验要求:(1)分别应用最小距离法(singlelinkage)、最大距离法(comp

8、letelinkage)、平均距离法(averagelinkage)对湖北省的13个城市进行聚类分析;(2)画出以上三种方法聚类分析结果的树状图,比较异同;(3)用最小距离法将13个城市聚为3类,并将聚类结果存储在一个SPSS数据文件中;(4)对表-1中的人均各项消费支出进行聚类分析。实验题目一分析报告:1.实验(实训)过程(步骤、记录、数据、程序等)2.结论(结果、分析)实验题目二分析报告:1.实验(实训)过程(步骤、记录、数据、程序等)2.结论(结果、分析)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。