实验十三聚类分析(2)删减版

实验十三聚类分析(2)删减版

ID:41699819

大小:125.36 KB

页数:23页

时间:2019-08-30

实验十三聚类分析(2)删减版_第1页
实验十三聚类分析(2)删减版_第2页
实验十三聚类分析(2)删减版_第3页
实验十三聚类分析(2)删减版_第4页
实验十三聚类分析(2)删减版_第5页
资源描述:

《实验十三聚类分析(2)删减版》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、课时授课计划课次序号:.30一、课题:实验十三谱系聚类法二、课型:上机实验三、口的要求:1•掌握谱系聚类分析的理论与方法、模型的建立;2.掌握利用谱系聚类分析的SAS过程解决有关实际问题.四、教学重点:谱系聚类分析的SAS过程.教学难点:谱系聚类分析的理论.五、教学方法及手段:传统教学与上机实验相结合.六、参考资料:《应用多元统计分析》,高惠璇编,北京大学出版社,2005;《使用统计方法与SAS系统》,高惠璇编,北京大学出版社,2001;《多元统计分析》(二版),何晓群编,中国人民大学出版社,2008;《应用回归分析》(二版),何晓群编,中国人民大学出版社,2007

2、;《统计建模与R软件》,薛毅编著,清华大学出版社,2007.七、作业:写出谱系聚类步骤,类间距离公式,6.76.9或补充八、授课记录:授课FI期班次九、授课效果分析:实验十二聚类分析(2)2学时一、实验目的和要求理解并能运用系统聚类分析方法,对实际问题进行分类.能根据实际问题采用恰当的距离进行聚类,并确定分儿类最合适,并能解释每个类的特点及类与类Z间的区别.二、实验内容1.系统聚类的SAS过程一PROCCLUSTER过程基本语句:PROCCLUSTER

3、S集1>;VAR变量;/*列出参与聚类分析的指标变量名称*/ID样品名称;/*样品名称,可以是定性、定量变量*/RUN;PROCTREEvHOR>;ID样品名称;RUN;FASTCLUS后面选项:(1)METHOD=name:此语句为必需,指出使川的聚类方法.SINGLE(或SIN)—最短距离法;COMPLETE(或COM)—最长距离法;AVERAGE(或AVE)—类平均法;CENTROID(或CEN)—重心法.(2)NOSQUARE:阻止类平均法和重心法

4、中将距离平方.(3)NONORM:阻止将两类合并时的距离水平规范化.若无此选项,规范化距离水平等于原始距离水平除以两两样品间的平方距离的平方根.(4)STD(或STANDARD):将原始数据标准化后再计算欧式距离矩阵,即利川方差加权距离进行聚类分析.(5)OUTTREE=SAS集1:牛成一个用于画谱系聚类图的输出SAS集.若省略,自动半成DATA1等.1.谱系聚类方法(1)类间距离及其递推公式样品间距离:可选用欧式距离、明氏距离、马氏距离等,一-般用欧式距离.记血=心,勺),G厂{第),呼),…,叱)}和6={屮,垮),…乂:)}为两个类,类GJ勺重心•1)类G”与

5、G“间距离Dpq.Gf)和Gq合并得Gr,类间距离f、类间距离递推公式4种:最短距离、递推公式Dpq=min2)Drk=nin]dijieGrJe最长距离.递推公式Gk}=mm{Dpk,D({k}递推公式5=max{Dpk,D(lk}=max{d帀ieG「jgGk}3)类平均距离.递推公式dp(i=—yYt/..——两类中所有两两样晶之间的距离的平均Iyin…赢靠九光心严递推公式Pk类平方距离d爲=丄y工盃——两类屮所启两两样品之间的平方距离—i叫叫递推公式吩丘靠盃诗咛紳4)重心距离.递推公式Dp(i=d(元〃,爲)——两类的重心之间的距离作为两类间的距离°nnn

6、心°nn0qk吩誥咛严-誘严递推公式(2)谱系聚类法的步』

7、:11)n个样品开始时作为n个类,计算两两之间的距离,构成一个对称距离矩阵此时D(p,q)=dpq2)选择D(0)q«主对角线以下(或以上)最小元索,设为这时Gp={xr}与={_},将G〃与q合并为新类GK={Gp,G(/],在D(o)中消去G〃与G“对应的行与列,加入新类G「与剩下未聚合的类间距离所组成的一行和一列,得新的/:-1阶距离矩阵D⑴.3)重复步骤(2),得£>⑴TD⑵T…tD(t,n个样品聚为一个人类.4)记卜•合并样品的编号及两类合并时的距离(称为距离水平),绘制聚类谱系图.1.应用举例(

8、X)样品聚类举例例1(例6.4)对表6.1所列的13个国家可持续发展综合国力的数据按下列方法进行谱系聚类分析,采用标准化数据聚类并给出聚为4类的结果.(1)最短距离法;(2)最长距离法;(3)类平均距离法;(4)重心法.解(1)最短距离法在proccluster过程屮取选项“method=siiigle,,和"standard”,得基于标准化数据的最短距离法的聚类过程如表6.9所示.dataexampl;inputcountry$xlx2x3;cards;澳大利亚1249.391273・611282.68巴西821.60859.85919.73加拿大1641.0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。