基于k―means的自动三支决策聚类方法

基于k―means的自动三支决策聚类方法

ID:28197903

大小:18.07 KB

页数:5页

时间:2018-12-08

基于k―means的自动三支决策聚类方法_第1页
基于k―means的自动三支决策聚类方法_第2页
基于k―means的自动三支决策聚类方法_第3页
基于k―means的自动三支决策聚类方法_第4页
基于k―means的自动三支决策聚类方法_第5页
资源描述:

《基于k―means的自动三支决策聚类方法》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。基于k―means的自动三支决策聚类方法  摘要:应用广泛的k-means算法结果是一种二支决策的结果,即对象要么属于某个类要么不属于这个类,这种决策方式难以适用于一些具有不确定现象的环境,因此提出三支决策聚类方法来反映对象与类之间的关系,即:对象确定属于某类、可能属于某类或确定不属于某类。显然,二支决策是三支决策的一种特例。此外,

2、从类内紧凑性和考虑近邻类间分离性角度出发,定义了分离性指数、聚类结果评估有效性指数,并提出了一种自动三支决策聚类算法。该方法为处理具有不确定信息的基于k-means算法框架的聚类数目自动确定的难题提供了一种新的解决思路。在人工数据集和UCI真实数据集上的初步对比实验结果表明所提出的方法是有效的。  关键词:聚类;三支决策;有效性指数;k-means算法  中图分类号:TP391  文献标志码:A  0引言为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏

3、目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。  k-means算法[1]自提出50多年来,在聚类分析中得到了广泛应用,更多的介绍请参见文献[2]。但是,k-means算法存在一个突出的问题,即需要预先设定聚类数目。所以,本文针对如何自动获取k-means的聚类数目进行了研究。为了确定聚类数目,许

4、多学者从聚类有效性指数方面进行了研究,该类成果大多数都结合了类内紧凑性和类间分离性这两个因素[3-10]。一般说来,这些方法用类中对象和类中心距离的平均值及其变形来衡量类内紧凑性,用类中心之间的距离来衡量类间分离性。它们较少考虑类中对象数目的多少以及对象的分布情况,因此在某些情况下不能很好地度量类间的分离情况。本文从类内紧凑性和考虑近邻的类间分离性出发,定义新的分离性指数,并设计了新的有效性指数。  另一方面,k-means算法得到的结果实际上是一种二支决策结果,只考虑了对象与类的两种关系,即:对象要么属于

5、一个类要么不属于一个类。这种聚类结果没有反映某些应用背景下的对象与类的不确定性关系,即对象可能属于某个类。因此,本文提出了三支决策聚类,来进一步表示对象与类的不确定性关系。基于三支决策聚类的思想,笔者相继在基于密度的重叠聚类[11]、不完备数据聚类[12]、重叠区域细分[13]、增量重叠聚类[14]等方面进行了一些研究工作。  因此,本文引入三支决策思想[15],提出一种基于k-means算法框架的自动三支决策聚类方法,该方法扩展了k-means算法使之适用于不确定性聚类,并能够自动地得到聚类数目。  问题

6、分析为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。  传统分离性指数大多通过计算类中心的距离及其变形来获取,只通过类中心距离计算类的分离性并没有考虑到类的大小和对象分布情况,这样得到的结果不一定

7、合理,如图1所示。  图1中有三个类C1、C2和C3,类中心点用三角形表示,分别记为v1、v2和v3。d表示对象xi和类中心v的距离。如果d=d,按照传统的分离性公式只考虑类中心之间的距离,类C2和C1之间的分离性与类C3和C1相同。然而,观察样本,有相当多的C2类数据点离C1更近。就这个简单的例子可见,计算类间分离性时,仅仅计算类中心之间的距离并不一定总是合理的,还应该综合考虑类中数据对象分布特性以及类中对象数目。  2自动三支决策聚类算法  考虑近邻的有效性指数  关于紧凑性指数的定义很多都是基于文献[

8、16]的工作扩展的。类C的紧凑性表示类中对象整体分布的紧凑程度,设n为类C中对象的数目,则计算公式如下:为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。