聚类分析在STATA中的实现和案例

聚类分析在STATA中的实现和案例

ID:41807592

大小:350.04 KB

页数:8页

时间:2019-09-02

聚类分析在STATA中的实现和案例_第1页
聚类分析在STATA中的实现和案例_第2页
聚类分析在STATA中的实现和案例_第3页
聚类分析在STATA中的实现和案例_第4页
聚类分析在STATA中的实现和案例_第5页
资源描述:

《聚类分析在STATA中的实现和案例》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第15章聚类分析聚类分析是根据样品或指标的“相似”特征进行分类的一种多元统计分析方法,其目标是发现样品或指标的自然分类方法。在社会经济领域中存在着人量分类问题,比如对我国31个省市自治区独立核算工业企业经济效益进行分析,一般不逐个分析省市自治区,而较好的做法是选取反映企业经济效益的代表性指标,如百元固定资产实现利率、资金利税率、产值利税率、百元销售收入实现利润、全员劳动牛产率等等,根据这些指标对31个省市自治区进行分类,然后根据分类结果对企业经济效益进行综合评价,就易于得岀科学的分析。聚类分析方法包括两个体系:系统聚类和非系统聚类。系统聚类法包括最短距离法、最长

2、距离法、中间距离法、可变距离法、重心法、类平均法、加权类平均法、血rd最小方差法。非系统聚类方根包括K均值、K中位数法。15.1相似性测度很多多元统计方法,包括聚类分析,是基于变量或观测值的相近程度來分析的,因此在介绍聚类的Stata命令之前,我们首先介绍一下Stata中关于矩阵相似性或异性的测度方法。统计学中用各种距离来测度变量或观测值的和似性或和异性。一般将这种相似性称为相似系数,来刻画两个指标的相似程度,相似系数绝对值越接近于1,表示两个指标之间的关系越密切,相似系数绝对值越接近于0,则表示两个指标Z间的关系越疏远。Stata计算相似性的命令格式如下:ma

3、trixdissimilaritymatname=[varlist][if][in][’options]一般情况下,我们选用默认情况就行了,对于options不用去理。15.2系统聚类法命令格式1(利用数据进行系统聚类):clustersinglelinkage[varlist][if][in][,options]最短距离法将两个组之间最接近的一对观测案例之间的相异性作为两个组之间的相异性来加以计算。尽管简单,但是这一方法对特异值或测量错误的耐抗性较差。观测案例是一次性聚类,往往形成非平衡的、不断加大的组。在这组中,成员很少具有共性,但是又通过中间观测案例连结起

4、來,这种问题被称作链接问题。clustercompletelinkage[varlist][if][in][,options]最长距离法使用两组Z间距离最远的一对观测案例作为代表。该方法对特异值没有最短联结法那样敏感,但具有相反的倾向,即容易将许多案例聚集成空间紧密的群。clusteraveragelinkage[varlist][if][in][,options]类平均法使用两个组之间观测案例的平均相异性,产生的属性居于最短联结法和最长联结法之间。模拟研究报告表明,这一方法在许多情况下都表现很好,并且合理地稳健。这种方法常用于考古学中。clusterwaver

5、age1inkage[varlist][if][in][,options]加权类平均法clustermedianlinkage[varlist][if][in][,options]中间距离法加权平均联结法和中位数联结法分别是平均联结法和重心联结法的变种。在这两种情形屮,差异在于不等规模的组在合并时是如何处理的。对于平均联结法和重心联结法说,每一组元素的数量被分解到计算中,并对更大的组相应地赋予更大的影响(因为每条观测案例权数相同)。对于加权平均联结法和中位数联结法而言,不管每组中有多少观测案例,两个组都被赋予相同的权数。同重心联结法一样,屮位数联结法也很容易受到

6、逆转的影响。clustercentroidlinkage[varlist][if][in][,options]重心法重心法合并那些平均数最为接近的组(与基于两组元素之间平均距离的平均联结法不同)。这一方法容易发生逆转,即某次聚合的点比前面的聚合的相异性水平更低。逆转是聚类结构不稳定的迹彖,它难以解释,并且不能用clustertree画岀来。clusterwardsiinkage[varlist][if][in][,options]Ward最小方差法合并能使误差平方和增加最少的两个组。尽管可以适当地处理多元正态和相似规模的组,但是在聚类具有不相等的观测案例数吋表现

7、较差。命令格式2(利用矩阵进行系统聚类,一般是用于分等级变量的聚类分析):clustermataverage1inkage[varlist][if][in][,options]clustermatmedianlinkage[varlist][if][in][,options]clustermatwardslinkage[varlist][if][in][,options]clustermatwaveragelinkage[varlist][if][in][,options]clustermatsinglelinkage[varlist][if][in][,opt

8、ions]cluster

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。