欢迎来到天天文库
浏览记录
ID:59414918
大小:1.83 MB
页数:52页
时间:2020-09-19
《SAS判别分析和聚类分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、汇报人:AAA2013年6月21日判别分析l判别分析简介icktoaddTitle1一般判别分析ktoaddTitle2典型判别分析addTitle3逐步判别分析toaddTitle41.判别分析简介确定类别Titleinhere归类已知数据样本函数判别方法2.一般判别分析距离判别法通过计算距离函数来进行判别,即样品与哪个总体之间的距离最近,则判断它属于哪个总体。我们一般利用马氏距离来描述。Bayes判别法假定事先对对象有了解,通过先验概率分布来描述,抽取样本后,用样本修正先验概率分布,并得到后验概率分布,然后统计推断。方法42.一般判别分析语句说明1例题及过程基本过程语句说
2、明2SAS过程132452.一般判别分析62.一般判别分析72.一般判别分析82.一般判别分析各类间的平方距离和线性判别函数92.一般判别分析回判结果102.一般判别分析回判汇总结果及各类错判比例112.一般判别分析对待确定的数据判定结果122.一般判别分析对分类情况的汇总133.典型判别分析主要思想143.典型判别分析PROCDISCRIMDATA=典型变量数据集;CLASS分类变量名;VAR典型变量名;RUN;PROCCANDISCDATA=数据集;CLASS分类变量名;VAR变量名列表;BY分组变量名;RUN;153.典型判别分析163.典型判别分析在临时数据库work
3、下数据集下可以查看到数据集CAN,为每个观测对应的典型变量得分173.典型判别分析典型变量系数183.典型判别分析根据典型变量的分类结果194.逐步判别分析建立辨别函数循环,直到不进不剔剔除逐个引入在建立判别函数时逐个引入变量,每一步选择都一个判别能力最显著的变量进入判别函数对已有的变量也进行检验,将不显著的变量剔除直到在可选的变量中,既没有变量被选入也没有变量被删除为止。最后得到的判别函数中,所有变量都是显著的204.逐步判别分析两步走2.利DISCRIM过程依据筛选出的变量进行判别分析。SAS过程1.STEPDISC过程对变量进行筛选,在得出筛选结果在进行逐步判别分析时,
4、使用STEPDISC过程只能完成变量的筛选。要实现完整的判别分析,则还需要联合使用DISCRIM过程。214.逐步判别分析224.逐步判别分析234.逐步判别分析逐步筛选过程的总结244.逐步判别分析DISCRIM过程判别结果25聚类分析简介系统聚类快速聚类变量聚类聚类分析分类的问题一般有两种:一是根据已知的类别将现有的样品归属于其中的某一类;另一种是在不知道要分的类别甚至不知道要分几类的情况下,根据现有样品自身的性质和它们相互之间的接近程度进行划分归类。前者一种问题可以通过判别分析的方法来处理,这在上一章已经做出了介绍;后者则可以通过聚类分析来加以解决,我们将在本章中予以介
5、绍。聚类分析从数值分类学发展而来,它引入了数学和多元统计的方法,克服了定性分类的主观性和随意性,能够比较合理地揭示客观事物内在的特征与联系,对于大样本、多因素以及多指标问题更体现出了其优势所在。根据聚类对象的不同,可以将聚类分析分为两种:Q型聚类和R型聚类。Q型聚类是对样品进行分类,R型聚类则是对变量(指标)进行分类。1.聚类分析简介系统聚类的基本思想是:首先定义样品间的距离以及类之间的距离,然后将距离最近的样品聚成一类,再减少类的个数并将距离较近的样品聚到一类,这个过程一直进行下去,使得每个样品都能聚到合适的类中。具体地来说,系统聚类的过程是:第一步,直接将n个样品独自划为
6、一类,即共有n类;第二步,先计算上一步中任意两类(即两两样品)之间的距离,然后将距离最近的两类(也就是两个样品)聚为一类,这样共有n-1类;第三步,先计算上一步中任意两类之间的距离,再将距离最近的两类合并为一类,这样共有n-2类;这样的步骤一直进行下去,直到最后将所有的样品都聚为一类。2.系统聚类为了直观地反映每一步聚类的结果,可以将以上的聚类过程绘制成谱系图进行分析,所以系统聚类又称为谱系聚类,2.系统聚类根据系统聚类的原则,将距离最小的两类合并为新的一类。由类间距离的不同定义产生了不同的系统聚类方法。常用的系统聚类法有:(1)类平均法(AverageLinkage)(2)
7、最短距离法(SingleLinkage)(3)最长距离法(CompleteMethod)(4)中间距离法(MedianMethod)(5)重心法(CentroidMethod)(6)可变类平均法(Flexible-BetaMethod)(7)Ward最小方差法(Ward’sMinimum-VarianceMethod)(8)McQuitty相似分析法(McQuitty’sSimilarityAnalysis)(9)最大似然法(EML)(10)密度估计法(DensityLinkage)(11)两阶段密度估
此文档下载收益归作者所有