数理统计大作业二SY1106404_罗杨_应用数理统计_大作业二.doc

数理统计大作业二SY1106404_罗杨_应用数理统计_大作业二.doc

ID:35807797

大小:506.00 KB

页数:12页

时间:2019-04-19

数理统计大作业二SY1106404_罗杨_应用数理统计_大作业二.doc_第1页
数理统计大作业二SY1106404_罗杨_应用数理统计_大作业二.doc_第2页
数理统计大作业二SY1106404_罗杨_应用数理统计_大作业二.doc_第3页
数理统计大作业二SY1106404_罗杨_应用数理统计_大作业二.doc_第4页
数理统计大作业二SY1106404_罗杨_应用数理统计_大作业二.doc_第5页
资源描述:

《数理统计大作业二SY1106404_罗杨_应用数理统计_大作业二.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于聚类分析和判别分析法的广东省各市人民生活水平分类研究学号:SY1106404姓名:罗杨学院:计算机学院时间:2011-12-13摘要本文以反映人民生活水平的8项主要指标为依据,从《广东统计年鉴2011》获得2011年相关数据,利用SPSS统计分析软件对广东省各市作聚类分析和判别分析。经分析,聚类结果符合直观印象,判别分析回报率为100%。关键词聚类分析判别分析城市分类人民生活水平广东省SPSS引言研究现阶段的广东省各市人民生活水平的差异,我们需要对各市作分类研究。聚类分析和判别分析是研究事物分类的基本方法,广泛地应用于自然科学、社会科学、工农

2、业生产的各个领域。聚类分析研究怎样对事物作合理的归类。其基本原理是把某种性质相似的对象归为一类,而不同的类之间是有较大差异的。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数

3、,并计算判别指标。据此即可确定某一样本属于何类。判别分析有二级判别、多级判别、逐步判别等多种方法。使用聚类分析法和判别分析法对广东省各市人民生活水平作分类研究,首先要选择反映人民生活水平的指标。《广东统计年鉴2011》列出了多项反映社会经济文化等发展状况的数据,在人民生活水平方面,列出了在岗职工平均人数、在岗职工工资总额、居民人均可支配收入、居民人均消费支出、居民消费价格指数、基本养老保险参保人数、基本医疗保险参保人数、失业保险参保人数等8项指标,本文使用这8项指标2011年的数据利用SPSS软件对广东省21个地级市人民生活水平作聚类分析和判别分

4、析。正文采取的分析步骤1.收集原始数据2.聚类分析3.判别分析4.小结分析过程1.收集原始数据本文的数据来自《广东统计年鉴2011》,收集了2011年反映广东省21个地级市人民生活水平的8项不同指标的数据。图1统计数据图中各个标记的单位:1.市名,收集了从广东省下属21个地级市(广州市等)的数据2.在岗职工平均人数,单位:万人3.在岗职工工资总额,单位:亿元4.居民人均可支配收入,单位:元5.居民人均消费支出,单位:元6.居民消费价格指数,(以上一年数据为100)7.基本养老保险参保人数,单位:万人8.基本医疗保险参保人数,单位:万人9.失业保险

5、参保人数,单位:万人2.聚类分析聚类分析步骤:1.选择ClassifyAnalyze;2.选择HierarchicalCluster;3.Cluster组合框中选择”Cases”,LabelCasesby“市名”,将其它8个指标加入到Variables中,其它选项使用默认值;4.打开Statistics对话框,选中AgglomerationSchedule和Proximitymatrix。由于要作聚类分析的城市较多,选择将其分为五种类型,因此在ClusterMembership中选中“Singlesolution”,并在Numberofclust

6、ers中输入“5”;5.打开Plots对话框,选中Denrogram,并在Icicle中选择“None;6.打开Method对话框,ClusterMethod选择“Within-groupslinkage”,Interval使用默认值。由于选取的8个指标的量纲不同,因此必须对其进行标准化后才可以进行准确的聚类分析。于是,在下部的TransformValues中的Standardize下拉列表中选取“Range0to1”,并将“Byvariable”单选按钮选中,该对话框其它选项均不选;7.打开Save对话框,选中“Singlesolution”并

7、在Numberofclusters中输入“5”;8.返回HierarchicalClusterAnalysis对话框,单击“OK”按钮,执行聚类分析。聚类分析结果:1.概要结果。从下表可以看出21个省市的数据全都有效,均用于系统聚类分析过程。CaseProcessingSummary(a)CasesValidMissingTotalNPercentNPercentNPercent21100.0%0.0%21100.0%aSquaredEuclideanDistanceused2.样本聚合过程。从下表可以看出系统聚类分析过程中的每一步。聚类分析过程

8、总共进行了20步,并在每一步中给出了凝聚过程中两类之间的相关系数。第一次聚合的是第十六个样本和第十八个样本,第二次聚合为第十六个样本和第

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。