基于划分的聚类算法研究与应用

基于划分的聚类算法研究与应用

ID:24239256

大小:64.50 KB

页数:4页

时间:2018-11-13

基于划分的聚类算法研究与应用_第1页
基于划分的聚类算法研究与应用_第2页
基于划分的聚类算法研究与应用_第3页
基于划分的聚类算法研究与应用_第4页
资源描述:

《基于划分的聚类算法研究与应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于划分的聚类算法研究与应用何宇成都信息工程大学摘要:随着数学、计算机科学以及统计学、生物学等的快速发展,促进了聚类算法的产生。聚类分析在数据的处理和分析当中有着举足轻重的作用,并且被广泛应用到多个领域,介于此人们发明出了聚类算法。这些算法可以被分为以划分方法为代表的多种多样的处理方法。今天我们着重来探讨一下棊于划分的聚类算法的研宂与应用。关键词:划分方法;聚类算法;研究与应用;作者简介:何宇(1985一),男,四川仁寿人,硕士,主要研究方向为网络安全及计算机应用。收稿日期:2017-05-05Received:2017-05-05随着我国的数学、计算机科

2、学以及经济学学科的快速发展,聚类算法得到广泛使用,加快丫数据处理与分析的速度,很大程度上促进/这些学科的发展。而且聚类算法的应用领域己经涉及生活和生产的方方而而,它是将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。这有很多具体应用的实例,比如说在商业方面,聚类分析方法可以帮助销售工作者找到不同的客户群,并且通过聚类分析中特定的模式来展现客户群的差异性。实际出真知,聚类分析方法对于市场的整体分析和数据处理等有着极其重要的作用,而且可以根据对客户群特点的分析准确把握客户的消费心理,这样一来能够促使厂商发现新的商机,开发新型的产业和地区市场,并且

3、能够将这些信息整合起来;在保险行业,聚类分析的应用更是在很大程度上解放的人力,很多数据的收集、处理变得极其方便,主要是根据地区的保险业的平均水平来划分的,以平均值为划分的界限,再结合局部地区的经济发展速度、人均工资水平以及对保险业的态度和购买程度进行分组;再者便是在近些年来最为流行的贸易方式一一电子商务。电子商务顾名思义用的就是计算机,其本身在数据处理上就占有一定的优势,利用聚类分析的方法使得电子商务中的交易数据和人群划分更加明显,交易人群特点的掌握有利于电商事业的发展,也为更近-步的商务交流提供了建设性的意见。1划分方法的基本概念及其常用的方法划分方法(

4、PAM:Partitioningmethod)的定义是首先创建k个划分,k为要创建的划分个数。常用的划分方法有:k-means,k-medics,CLARA(ClusteringLargeApplication),CLARANS(ClusteringLargeApplicationbaseduponRandomizedSearch).FCM。其中以k-means的使用最为普•通,严格来说k一means属于非层次聚类法f种,下面我们来看一下它的整个执行过程,一井分为两个部分,分别是初始化,循环。所谓初始化就是指选择或是人为指定某些记录作为凝聚点,但是要注意的

5、一点就是按就近原则进行初始化的选择,而丑要注意记录屮心的数据,最后根据记录数据重新进行这一过程。一直不断地重复这一过程,直到凝聚点位置收敛为止。这种方法一般具有节省运算时间等特点。2具体的运算过程2.1数据预处理数据预处理是指我们在对数据进行正式的处理之前,要先对数据的整体进行一下估量,主耍从数据的数量、范围、程度和既定标准这儿方面入手,进行规划分类和简单的预测分析,然后再就每一个方面对整体数据的影响进行估量式判断,建立起一个预测模式。m当然在我们有了明确的数据处理和分析结果时要将这一预测模式清楚,避免结果混淆。2.2定义距离函数聚类的产生是由于多个领域和

6、数据之间存在着和似性,正是由于事物之间和似性的存在,才促生了聚类的算法。但是这些相似性的存在也极容易造成事物之间的混淆。所以给这些数据设置一个定义函数是非常冇必要的。函数的设置是为了避免误差,所以在设置相似距离时一定要把握好度量,保持数据点之间的平衡,从而保证整个运算过程的准确性。2.3聚类或分组数据对象的分类要根据数据的特点、适应的环境或是发挥的作用等来进行分类,而II由于分类时采用的方法不同或是人为因素的干扰,总会产生不同的数据分组。划分方法一般从初始划分和最优化一个聚类标准开始。CrispClustering,它的每一个数据都属丁•革独的类;Fuzz

7、yClustering,它的每个数据可能在任何一个矣中,CrispClustering和FuzzyClustering是划分方法的W个主要技术,划分方法聚类方法具有自身的法则优势,它可以找到在不同的分类组之间的相似性,其至可以分析出在同一组内分类数据之间存在的差异性,我们常说数据的处理和分析要科学,要辩证的看到事物的两面性。m这种方法本身就是一种辩证的方法,所以用它来分析和处理数据最合适不过了。3聚类方法的主要应用研宄聚类算法在实际应用过程中涉及多个行业发展。从商业、生物、地理、保险行业、因特网行业以及电子商务行业等都所有涉猎。3.1商业在商业市场的发展过

8、程中,往往对于市场未知风险的预测是企业可持续发展的一个重要问题。如

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。