数据挖掘中聚类分析的研究

数据挖掘中聚类分析的研究

ID:33338132

大小:145.25 KB

页数:3页

时间:2019-02-24

数据挖掘中聚类分析的研究_第1页
数据挖掘中聚类分析的研究_第2页
数据挖掘中聚类分析的研究_第3页
资源描述:

《数据挖掘中聚类分析的研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第16卷第9期计算机技术与发展Vol.16No.92006年9月COMPUTERTECHNOLOGYANDDEVELOPMENTSep.2006数据挖掘中聚类分析的研究陈学进(合肥工业大学计算机与信息学院,安徽合肥230009;安徽工业大学计算机学院,安徽马鞍山243002)摘要:聚类分析是由若干个模式组成的,它在数据挖掘中的地位越来越重要。文中阐述了数据挖掘中聚类分析的概念、方法及应用,并通过引用一个用客户交易数据统计出每个客户的交易情况的例子,根据客户行为进行聚类。通过数据挖掘聚类分析,可以及时了解经营状况、资金情况、利润情况、客户群分布等重要的信息。对客户状态

2、、交易行为、自然属性和其他信息进行综合分析,细分客户群,确定核心客户。采用不同的聚类方法,对于相同的记录集合可能有不同的划分结果对其进行关联分析,可为协助各种有效的方案,开展针对性的服务。关键词:数据挖掘;聚类分析;客户行为中图分类号:TP311.13文献标识码:A文章编号:1673-629X(2006)09-0044-02ResearchofClusterAnalysisinDataMiningCHENXue-jin(ComputerandInformationCollegeofHefeiUniversityofTechnology,Hefei230009,Chi

3、na;ComputerCollege,AnhuiUniversityofTechnology,Maanshan243002,China)Abstract:Clusteranalysisismadeupofpatterns,andbecomingincreasinglyessentialindataminingfield.Thispaperbrieflyintroducesthebasicconcept,meansandapplicationofclusteranalysisdiscussingaboutclusteranalysisbyusingacaseofcus

4、tomertransaction.Inordertoknowaboutmuchimoportinformationofrunning,funds,profitsandcustomers.Andanalyzestateofclient,bargainingaction,naturalessattributeandotherinformation,subdividecustomergroupsandfixoncoreclient.Byusingvariousmethodsofclusteranalysis,itiseffec-tiveprojecttodeveloppe

5、rtinenceservice.Keywords:datamining;clusteranalysis;customeraction0引言领域,即数据挖掘(DataMining),或称数据挖掘和知识发自20世纪60年代数据库系统诞生以来,数据库技术现(DataMiningandKnowledgeDiscovery,DMKD)。这是已经得到了飞速的发展,并且己经深入到社会生活的各个在数据库技术、机器学习、人工智能、统计分析等基础上发方面。现在,数据无处不在,可以存放在不同类型的数据展起来的一个交叉性的学科。区别于简单地从数据库管库中,数据仓库技术可以将异构的数据库集成

6、起来进行综理系统检索和查询信息。数据挖掘是指“从数据中发现隐合管理,从而提供更好的服务。含的、先前不知道的、潜在有用的信息的非平凡过程”但是,随着科学技术的进步,新的数据采集和获取技(Frawley,1991),其目的是把大量的原始数据转换成有价术不断发展,使得数据库中所存储的数据量也随之急剧增值的、便于利用的知识。长。另一方面,数据处理技术的发展却相对落后,数据库自从数据挖掘和知识发现的概念于1989年8月首次技术仍然停留在相对简单的录入、查询、统计、检索阶段,出现在第11届国际联合人工智能学术会议以来,数据挖对数据库中的数据之间存在的关系和规则、数据的群体特掘和

7、知识发现领域的研究和应用均得到了长足的发展,形征、数据集内部蕴涵的规律和趋势等,却缺少有效的技术成了一些行之有效的理论和方法,并逐渐成为计算机信息手段将其提取出来,从而出现所谓的“被数据淹没,却饥渴处理领域的研究热点。于知识”(JohnNaisbett,1997)的现象[1]。为了解决这种现数据挖掘(DataMining)是一个多学科交叉研究领域,象,科学家们于20世纪80年代末期创立了一个新的研究它融合了数据库(Database)技术、人工智能(ArtificialIntel-ligence)、机器学习(MachineLearning)、统计学(Statist

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。