欢迎来到天天文库
浏览记录
ID:33505404
大小:380.02 KB
页数:64页
时间:2019-02-26
《基于数据挖掘技术的crm系统——数据挖掘技术在交叉营销和客户细分中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、华东船舶工业学院硕士学位论文基于数据挖掘技术的CRM系统——数据挖掘技术在交叉营销和客户细分中的应用姓名:王丹丹申请学位级别:硕士专业:@指导教师:刘同明20030101基于数据挖掘技术的CRM系统数据挖掘技术在交叉营销和客户细分中的应用摘要本课题将数据挖掘技术运用到CRM客户关系管理的交叉营销和客户细分模块中利用统计学和机器学习技术创建预测客户行为的模型指导商业决策本课题的主要研究工作和成果有1提出了基于H-Struct的频繁闭合项集挖掘算法H-C该算法将待挖掘数据库中的记录压缩在动态链接结构H-Struct中并在挖掘的过程
2、中通过自动调整链接结构适应下一步挖掘同时该算法还克服了传统频繁项集生成算法需要多次扫描数据库的缺点整个挖掘过程只需对数据库进行两遍扫描另外由于H-C算法仅仅挖掘频繁闭合项集使得该算法在提高挖掘效率的同时大大减少冗余关联规则的产生实验表明H-C算法在不同最小支持度阈值下的处理效率及不同数据量大小下的扩展性能优于传统的频繁闭合项集挖掘算法2进一步改进了H-C算法首先针对传统最小支持度阈值不利于发现长项集和具有低支持度高兴趣度项集的缺点引入局部相对最小支持度阈值指导挖掘其次设置全局最大支持度阈值帮助去除那些出现过于频繁的无用项集减少
3、算法时间开销最后本课题充分利用H-Struct动态链接结构的挖掘特点挖掘具有最大长度k的频繁闭合项集实验表明改进后的算法由于去除了很多高支持度的无用项集其挖掘效率与性能优于原H-C算法3为了得到完备的规则集合有效地指导预测过程本课题挖掘包含负项的关联规则同时对待挖掘关联规则的形式进行约束增强知识的实用性实例分析表明得到的关联规则集合是正确有效的4将挖掘得到的关联规则集合作为知识库并在这些知识的启发下运用EMYCIN的推理机制对客户数据进行营销预测获得该客户选择这项产品或服务的可信度本课题扩充了EMYCIN中的推理算法使之可以处
4、理后件为负项的规则实验结果表明了推理机制的合理与正确性5客户细分模块的数据挖掘应用为决策树分类本文选择gini指数作为建树时分裂属性的选择标准选择MDL作为剪枝标准在剪枝的过程中通过限定最终决策树的大小来保证决策树的可理解性关键词数据挖掘交叉营销客户细分关联规则决策树TheCRMSystemBasedonDataMiningTechniquesTheApplicationsofDataMiningTechniquesinTheCrossingMarketingandCustomersSegmentationABSTRACTIn
5、thisproject,weapplydataminingtechniquestocrossmarketingandcustomerssegmentationofCRMsystem,andbuildpredictivemodelforcustomers’activitywithstatisticsandmachinelearningtechniquestoguidecommercialdecision.Thecontentandachievementisshowingbelow:1.BasedonH-Struct,weputf
6、orwardanewfrequentcloseditemsetsalgorithmH-C.ThisalgorithmpoursthedatasetsintoH-Struct,anddynamicallyadjustslinksintheminingprocesstocaterfornextmining.Thisalgorithmovercomesthedisadvantageofmany-timedatabase-scans,whichisapropertyofthetraditionalalgorithmsandaccomp
7、lishestheminingprocesswithintwo-timescansonoriginaldatabase.Becausefrequentcloseditemsetsisincorporated,theH-Calgorithmsnotonlysubstantiallyreducesthenumberofredundantrulesbutalsohasthepowerofrapidminingallfrequentcloseditemsets.OurtestsindicatethatH-Cismoreefficien
8、tandmorepreferablethanthepreviouslyproposedmethodswhenprocessingdifferent-scaleanddifferent-supporting-thresholddatabases.2.H-Calgorithmis
此文档下载收益归作者所有