统计专业实验6

统计专业实验6

ID:22672725

大小:380.87 KB

页数:10页

时间:2018-10-30

统计专业实验6_第1页
统计专业实验6_第2页
统计专业实验6_第3页
统计专业实验6_第4页
统计专业实验6_第5页
资源描述:

《统计专业实验6》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、重庆工商大学数学与统计学院《统计专业实验》课程实验报告实验课程:统计专业实验六指导教师:叶勇专业班级:2011级统计三班学生姓名::杨茂茜学生学号::2011101306实验报告实验项目实验六聚类分析实验日期2014-4-2实验地点81010实验目的了解聚类分析的原理,并掌握聚类分析的方法和过程。实验内容1.根据信息基础设施的发展状况,已知20个国家和地区信息基础设施基本数据,对世界20个国家和地区进行聚类分析,并对结果进行判断。数据见实验指导书。2.根据2008年企国各省市居民消费结构,进行聚类分析。3.对重庆市各区县的经济发展类型进行聚类分析。实验思考题解答:1

2、.变景的测度类型有哪些?答:变量的测度类型有间隔尺度、顺序尺度、名义尺度。2.系统聚类法的思想是什么?答:首先将一定数量的样品或指标各自看成一类,然后根据样品或指标的亲疏程度,将亲疏程度最高的即距离最近或最相似的样品或指标进行合并。然后考虑合并后的类与其他类之间的亲疏程度再进行合并。重复这一过程直至将所有的样品或指标合为一类,得到这一聚类结果后,我们再根据具体的问题和聚类结果来决定应当分为儿类。3.最短距离法是不是一种优良的系统聚类方法,为什么?它适合于什么形态类的聚类?答:不是,因为最短距离法有链接聚合的趋势,合并之后,新的类与其他类的距离会缩短,形成聚类延仲的惜

3、况。它适合于样品散点图呈条形,甚至是S形的类。4.组间联结法和组内联结法都是计算所有样木对的平均距离,请说明其区别?答:组间平均链锁法是定义两个小类之间的距离为所有样本对间的平均距离。组A平均链锁法是对所有样本对之间的距离求平均值,包括小类之间的样本对、小类内的样本对。组间联结法利用了所有样本对距离的信息,克服/最短距离和最长距离屮的距离易受极端值影响的弱点。而组类联结法与组间联结法相比,它在聚类的每一步都考虑了类内部相似性的变化。实验运行程序、基本步骤及运行结果:一、根据信息基础设施的发展状况,已知20个国家和地区信息基础设施基本数据,对世界20个国家和地区进行聚

4、类分析,并对结果进行判断1、将分析数据导入SPSS,进行聚类分析,具体步骤为:Analyze->Classify->Hierarchicalcluster,将6项信息基础设施指标选入变量框中,将国家作力分突标准,革击plots选取Dendrogram(树形图)2、输出结果如下:平均联结(组之间)聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集2112147972.4850022121717744.376106331917957.646001345728549.08700105101359431.10200961112111361.75302971516

5、117089.6160014846307831.028001691()11482865.981561210520751994.250401511891247359.7260017121()181905933370901413232014119.41003151410153118684.1171271715258031137.99413101616242.172E715818178102.364E711141818281.339E816171919123.924E8018011615181714121113109•8•6•4♦207•5♦193參2•1••••1X••

6、仓•♦••冻••泌•••••豢••E詞4••孕'菊••nE美2XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX3XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX456789101112116171819XXXXXXXXXXXXXXXXXXXXXXXXXX树状阉:XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

7、XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXDendrograxnusingAverageLinkage(BetweenGroups)RescaledDistanceClusterCombineCASE0510152025LabelNumHhh+hH2471038568946570392111111111121墨波泰智巴俄印匈马中韩瑞丹瑞新英德法日美3、分析:由树状图可以看出,这20个国家和地区可以分为三类,第一类包括

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。