欢迎来到天天文库
浏览记录
ID:33180863
大小:1.93 MB
页数:63页
时间:2019-02-21
《关联规则挖掘算法研究及其在crm中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浙江工业大学硕士学位论文关联规则挖掘算法研究及其在CRM中的应用姓名:陈海珍申请学位级别:硕士专业:计算机应用技术指导教师:黄德才20021201关联规则挖掘算法1iJ
2、死及』e“CRM中的府用摘要关联规则挖掘算法研究及其在CRM中的应用摘要数据挖掘(或知识发现)出现于20世纪80年代末,目前已经成为人工智能和数据库等领域的研究热点。它有着广阔的应用前景,并将在新的世纪里在各个领域发挥其强大的生命力。R.Agrawal等在1993年提出了关联规则问题,现在关联规则已经成为数据挖掘研究的重要方向,并且吸引了众多专家和学者的关注。本文比较研究了现有的关联规则挖掘算法如Apriori算
3、法、增量式更新算法等,发现存在问题有二,其中之一是当数据库中增加新的数据时,多数算法要重新扫描整个大型数据库,效率较低。另一个问题是由于现有算法中项目集的支持度是基于整个数据库计算的,当新增的数据中出现新项目时,即使包含新项目的项目集频繁地出现,现有算法常把这些项目集作为非频繁项目集,由此产生的关联规则不能反映最近的商业活动。本文根据以上算法存在的问题,首先提出了一个新的概念——敏感性,用来衡量各种关联规则挖掘算法对新项目的重视情况。然后一方面从改进算法的时间效率出发,引入一个参数C(1≤C≤。。),根据旧数据集的支持度大于或等于minsup/c的频繁项目集和新增数据集发现频繁项
4、目集,而不需扫描整个旧数据集:另一方面从敏感性出发,对于只出现在新数据集中的频繁项目集,则直接作为整个数据集的频繁项目集。紧接着本文通过实验把改进的算法与增量式更新算法进行了比较分析。最后结合数据仓库知识,探讨了如何把关联规则应用于客户关系管N(CRM)eP。关键词数据挖掘,关联规则,数据仓库,客户关系管理注:本项目获浙江省自然科学基金的资助(资助号为601076)关联规则挖掘算法研究及其相-CRM中的廊用摘要STUDYONALGORITHM0FMININGASSOCIATIONRULESANDTHEAPPLICATIONOFITINCRMABSTRACTDataMiningor
5、KnowledgeDiscoveryemergedinthelate1980shasbecomeahotspotinthefieldsofartificialintelligenceanddatabasetechnology.Datamininghasitswideapplicationprospectandisexpectedtocontinuetoflourishinthenewmillennium.R.Agrawaletc.firstputforwardtheissueofminingassociationrolesin1993.Nowithasbeenansignific
6、antcontentofdataminingandSOdrawsattentionofmanyresearchers.AfterwehavestudiedexistingalgorithmsofminingassociationrulessuchasApriori,IncrementalUpdatingalgorithmetc.,twoproblemsarefound.Oneoftheproblemsisthatmostofthealgorithmsmustscanthewholelargedatabasewhennewdataareaddedtoit.Soitwillmaket
7、hediscoveringfrequentitemsetsveryslow.AnotherproblemisthattheitemsetswhichincludesnewitemswillbeoRenregardedasunfrequentitemsetseveniftheyhappenedfrequentlyinnewdatasetbecausethesupportoftheitemsetsiscalculatedbasedonthewholedatabase.SotheassociationrulescomefromabovefrequentitemsetsCan’trefl
8、ecttherecentbusinessactivity.Havingknowntheproblemsofexistingalgorithms,firstIbringforwardanewconcept--sensitivitytomeasurehowmuchthealgorithmsthinksofthenewitemswhichappearedinthenewdataset.Thenontheonehandaparameterc(1≤c≤o。、isintroducedfori
此文档下载收益归作者所有