资源描述:
《关联规则技术在crm中的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中南民族大学硕士学位论文关联规则技术在CRM中的研究与应用姓名:黄雄申请学位级别:硕士专业:计算机应用技术指导教师:宋中山20100501中南民族大学硕士学位论文摘要分析了目前数据挖掘的常用技术,以及数据挖掘技术在CRM中的应用,深入研究了经典关联规则挖掘算法Apriori算法。Apriori算法的主要问题是常常会产生巨大数量的项集和规则,以至于一般用户很难从中挖掘出真正有用的规则。其次是多次扫描事务数据库,过多的进行I/O操作。对每次k循环,候选项目集Ck中的每个元素都必须通过扫描一次数据库来验证其是否
2、加入Lk。针对经典Apriori算法的不足,从减少数据库的扫描次数入手,提出了一种改进的Apriori算法-快速Apriori算法,快速Apriori算法在查找最大的频繁项集的过程中,只需要扫描数据库一次来完成分离和统计整个数据库。当扫描完整个数据库并计数后,系统将会从所有的业务数据集{C1,C2,…,Ck}中得出候选项集。然后根据最小支持度和置信度对候选项集进行剪枝,从1到k项集中确定出频繁项集。和Apriori算法相比,快速Apriori算法大幅度的减少了扫描数据库的次数,并且不需要进行合并和修剪操作。
3、扫描完数据库后,就能根据最小支持度和频繁项集的特性来确定所有的频繁项集{L1,L2,…,Li,(i=1,2,…,k)},并能通过剪枝后的频繁项集表得出最大的频繁项集。根据最大频繁项集和置信度可以确定数据间的强关联规则。改进后的算法使得数据挖掘的效率和挖掘质量都得以提高,而且也大大减少了系统资源的占用。分析了关联规则技术在CRM的具体应用,并通过一个实例详细分析了快速Apriori算法在CRM客户分类中的具体实现。关键词:数据挖掘,CRM,关联规则,频繁项集,快速Apriori算法I中南民族大学硕士学位论文A
4、bstractInthispaper,thecurrentcommonlyuseddataminingtechniques,andtheirapplicationsinCRMhavebeenanalyzed.ThetypicalassociationruleminingalgorithmApriorialsohasbeendeeplystudied.AmainproblemforApriorialgorithmis,itmayoftencreateahugenumberofitemsets(andrules
5、),andthegeneraluserswillhardtodigoutusefulrules.Besidesthis,itmayscanthetransactiondatabaserepeatedlytocausetheheavyoperationsonI/O.Foreachkcycle,everyelementinitemsetsCkmustscanthedatabaseoncetoverifywhetheritjointheLK.ReferringtothelimitationofApriori,co
6、nsideringthedatabasescanningnumber,inthispaper,aimprovedApriorinamedFastApriorialgorithmhasbeenproposed.IntheFastApriori,onlyoncescanningcouldseparateandstatistictheentiredatabaseintheprocessofsearchingforthelargestfrequentitemsets.Whenfinishtheentiredatab
7、asescanningandthecounting,systemwillderivethecandidateitemsetsfromtheoperationaldatasets(C1,C2...Ck),then,willprunethecandidateitemsetsaccordingtotheminimumsupportandtheconfidenceinordertoidentifythefrequentitemsetsfrom1tok.ComparedwiththeoriginalApriorial
8、gorithm,theFastApriorigreatlyreducethedatabasescanningnumber,andneednotoperatemergeandtrim.Afterscanningdatabases,allthefrequentitemsets{L1,L2…Li,(i=1,2,…k)}couldbeconfirmedaccordingtotheminimumsupportandthec