面向电子商务的数据挖掘中聚类算法的研究

面向电子商务的数据挖掘中聚类算法的研究

ID:32477701

大小:2.34 MB

页数:57页

时间:2019-02-07

面向电子商务的数据挖掘中聚类算法的研究_第1页
面向电子商务的数据挖掘中聚类算法的研究_第2页
面向电子商务的数据挖掘中聚类算法的研究_第3页
面向电子商务的数据挖掘中聚类算法的研究_第4页
面向电子商务的数据挖掘中聚类算法的研究_第5页
资源描述:

《面向电子商务的数据挖掘中聚类算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号TP393密级Y1219666重庆邮电大学硕士学位论文论文题目面向电子商务的数据挖掘中聚类算法的研究英文题目Reseachofclusteringalgorithmindataminingtechnologyorientedelectroniccommerce硕士研究生伍育红指导教师胡向东教授肿争士学科专业计算机应用技术论文提交日期垄QQ2主量旦堡文答辩日期2QQ2生鱼旦2呈论文评阅人耋盘煎查选重盘竖皇查壁羹堡盘盘煎毫盘!莶燧答辩委员会主席涂亚庆教授后勤工程学院2007年5月20日重庆邮电大学硕士论文摘要在信息和知识经济时代伴随着计算机技术和网络技术的不断发展,

2、企业纷纷建立自己的商务网站,开展电子商务活动,日积月累网站上生成了大量的与客户有关的记录信息,这些信息对企业来说应该是一笔非常宝贵的财富,如果能得到充分挖掘,发现背后蕴涵的有用知识,为企业业务决策和战略发展服务,企业将会在市场竞争中占据有利地位,应运而生的数据挖掘技术给出了有效的解决方法,它能够对大量的、不完全的、有噪声的、模糊的、随机的数据进行挖掘,提取隐含在其中的、事先不知道但又是潜在有用的信息和知识。而聚类分析是数据挖掘技术中重要的组成部分,从技术角度讲,它的主要目的是将数据空间中的数据点划分到若干个类中。其中,将距离相近的数据点划分到相同的类中,而将距离较远的

3、数据点划分到不同的类中。目前,已经提出了很多的聚类算法,它们基本上可以分为以下几种方法:划分方法、层次方法、基于密度、基于网格和混合方法等方法,这些方法各有优缺点。本文通过分析基于网格与基于密度的聚类算法特征,提出了一种基于网格和密度的混合聚类算法,通过分阶段聚类并选取代表单元中的种子对象来扩展类,从而减少区域查询次数,实现快速聚类。该算法保持了基于密度的聚类算法可以发现任意形状的聚类和对噪声数据不敏感的优点,同时保持了基于网格的聚类算法的高效性,适合对大规模数据的挖掘,并且实验数据分析验证了算法的有效性。在聚类分析领域中另一个长期困扰研究者的典型问题就是聚类参数的设

4、置问题。只有合理的设置聚类参数才能聚类出高质量的聚类结果。然而被聚类的数据集分布情况在聚类前往往是未知的,所以难以设置合理的聚类参数。而设置不合理的聚类参数又使得聚类结果质量变低。所以聚类参数设置问题应该首先被解决好。本文对网格聚类算法进行了深入地分析研究。在研究了传统网格聚类算法的基础上,针对网格聚类算法对参数敏感的问题,提出了一种基于网格的参数自动化聚类算法,该算法使用参数自动化技术解决了算法对参数敏感的问题。并在综合数据集和真实数据集上进行测试,最后给出实验结果,同时分析了该算法的时间复杂度和空间复杂度。关键词:数据挖掘,聚类,网格聚类,密度单元,参数自动化重庆

5、邮电大学硕士论文摘要AbstractIntheeraofinformationandknowledge-basedeconomy,alongwiththeconstantdevelopmentofcomputerandnetworktechnology.Businessenterpriseshavesetuptheirownwebsites,dide—commerceactivities.accumulatewebsitegeneratedalotofinformationandrecordsrelatingtoclients.Informationontheseen

6、terprisesshouldbeanextremelyvaluableassetifthatcanbefullytapped.Implicationfoundbehindtheusefulknowledgefordecision-makingandstrategicbusinessdevelopmentservices,willbeinafavorablepositioninmarketcompetition,therequirementofthedataminingtechnologygivesaneffectivesolution.itiscapableofla

7、rge、incomplete、noisy、fuzzy、randomdatatododatamining,extracttheimplicit、previouslyunknown、butpotentiallyusefulinformationandknowledge.ThenClusteranalysisisaprimarymethodfordatamining.Themaintaskofclusteranalysisistopartitiondatapointsintoseveralclusters.Datapointsthatareclosetoe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。