实验报告八-SAS聚类分析与判别分析

实验报告八-SAS聚类分析与判别分析

ID:44607238

大小:1.66 MB

页数:54页

时间:2019-10-24

实验报告八-SAS聚类分析与判别分析_第1页
实验报告八-SAS聚类分析与判别分析_第2页
实验报告八-SAS聚类分析与判别分析_第3页
实验报告八-SAS聚类分析与判别分析_第4页
实验报告八-SAS聚类分析与判别分析_第5页
资源描述:

《实验报告八-SAS聚类分析与判别分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实验报告实验项目名称所属课程名称实验类型实验日期聚类分析与判别分析统计分析及SAS实现验证性实验2016-12-19数学与应用数学班级学号姓名成绩实验概述:【实验目的及要求】掌握SAS中根据样木或变量按照其性质上的亲疏、相似程度进行聚类分析的方法以及判别样品所属类型的判别分析的方法。掌握SAS系统中编程实现聚类分析与判别分析的方法。【实验原理】SAS软件的操作方法及原理【实验环境】(使用的软件〉SAS9.3实验内容:【实验方案设计】一.理解聚类分析、判别分析的基本概念;二.掌握系统聚类法的基本思想和步骤;三.掌握

2、判别分析的距离判别法、Fisher判别法和Bayes判别法;四.利用编程proc过程步实现系统聚类法与判别分析。【实验过程】(实验步骤、记录、数据、分析》【练习8T】为了更深入了解我国人口文化程度状况,现利用1990年全国人口普查数据对全国30个省、直辖市、自治区进行聚类分析。分析选用了三个指标变量:大学以上文化程度的人口占全部人口的比例(DXBZ),初中文化程度的人口占全部人口的比例(CZBZ),文盲半文盲人口占全部人口的比例(DXBZ),原始数据如表所示。表1990年全国人口普查文化程度人口比例RegionN

3、umDXBZCZBZWMBZBeijing19.330.55&7Tianjing24.6729.388.92Hebei30.9624.6915.21Shanxi41.3829.2411.3Neimeng51.4825.4715.39Liaoning62.632.328.81Jilin72.1526.3110.49Heilongj82.1428.4610.87Shanghai96.5331.5911.04Jiangsu101.4726.4317.23Zhejiang111.1723.7417.46Anhui120.

4、8819.9724.43Fujian131.2316.8715.63Jiangxi140.991&8416.22Shandong150.9825.1816.87Henan160.8526.5516.15Hubei171.5723.1615.79Hunan181.1422.5712.1Guangdon£191.3423.0410.45Guangxi200.7919.1410.61Hairmn211.2422.5313.97Sichuan220.9621.6516.24Guizhou230.7814.6524.27Y

5、unnan240.8113.8525.44Xizang250.573.8544.43Shanxi261.6724.3617.62Gansu271.116.8527.93Qinghai281.4917.7627.7Ningxia291.6120.2722.06Xinjjiang301.8520.6612.75【解答】①利用proccluster过程步实现聚类分析:libneimclmf"E:sqshomcworklmfz/;procclusterdata=Lmf.p81standardmethod=wardou

6、ttree=Lmf•treelpseudo;varDXBZCZBZWMBZ;copyRegion;run;表&1结果:Ward,sMinimumVarianceClusterAnalysisEigcnvalucsoftheCorrelationMatrixEigenvalueDifferenceProportionCumulative2.219459561.588644790.73980.73980.630814770.481089090.21030.95010.149725680.04991.0000Theda

7、tahavebeenstandardizedtomean0andvariance1Root-Mean-SquareTotal-SampleStandardDeviation1Root-Mean-SquareDisteinceBetweenObservations2.44949由表8.1Ward离差平方和法得岀相关系数的特征值,其中各列数据分别为特征值(Eigenvalue)、与相邻特征值之差(Difference)、占总方差的百分比(Proportion)、占总方差累计百分比(Cumulative)。本题数据经过

8、标准化,样本均值(mcein)为0,方差(variance)为1。其中样本均方根标准差(Root-Mean-SquareTotal-SampleStandardDeviation)为],样品间均方根距离(Root-Mean-SquareDistanceBetweenObservations)为2.44949。表&2ClusterHistoryNumberofCluster

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。