探析利用数据挖掘实现电信业的客户流失预测分析

探析利用数据挖掘实现电信业的客户流失预测分析

ID:34818952

大小:2.34 MB

页数:70页

时间:2019-03-11

探析利用数据挖掘实现电信业的客户流失预测分析_第1页
探析利用数据挖掘实现电信业的客户流失预测分析_第2页
探析利用数据挖掘实现电信业的客户流失预测分析_第3页
探析利用数据挖掘实现电信业的客户流失预测分析_第4页
探析利用数据挖掘实现电信业的客户流失预测分析_第5页
资源描述:

《探析利用数据挖掘实现电信业的客户流失预测分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西南交通大学硕士学位论文利用数据挖掘实现电信业的客户流失预测分析姓名:王平申请学位级别:硕士专业:计算机应用技术指导教师:黄庆20030601西南交通大学硕士研究生学位论文第1页摘要客户频繁流失是f乜信企业发展中所嘶临的一个严嫩问题,随着国岁}电信运营商的灞入,这个闻麓必穆谶一步瑟纯。为减少或避兔雾户的流失,本文给出了~种行之有效的解决方案:利用数据挖掘知谈建立客户滚失羰测模毯,矮鼗模型挖援窭将要裹网懿客户,霉攫据这些客户的通话特征和业务瓣好采墩针对性的措施加以挽醋。本文困绕客户流失预测摸型的鲤个步骤避萼亍了

2、分辑:阉题豹定义,数据预处理,建立模型,模型优化与评估。问题姻定义中给出了要解决的阔题釉要实现的目标,数据预处理从魏筒选择样本数据、消除嗓寄、数獬转换、特巍是耩佳的选取方面进行了阐述。在属性选取时根据Fisher函数把对分类影响小的属毪瓣除,蠢Pearson’SCorrelationCoemcient褥稳关联蠡孽矮缝合并,用SingularValueDecomposition减少属性向量空间的维度。建摸楚颈测戆结栗是否毒应建玲毽瓣关键掇在,本文扶客户分饕和离网预测两大方面进行研究。客户分群作为预测的糕础为分类

3、器提供有:共同特征的用户群体,使{:导预测分手厅可以在不网的群体上进行。为了减少调憨簇中心所带来的计算代价,本文给蹬了一种改迸的肛平均算法来得到具肖相似特征的用户群体。离网预测采用了决策褥分类器,本文存摇述决策誊l

4、}箨法巾掰涉及蠲静建祷、代徐治莽、剪枝等问题之后,给出了在建树中和建树后分别加入限制条件的修努算法。建撵除段凌嚣大小限铡熬穆势簿法是迓_;童诗舞窭不究夔挝的最小代价得到优化树的代价上限,根据此上限以及计算出的节点懿实际代铃来修剪节点豹。在预测摸型中应用了在建越除段搬入大小限错条件的修翦算法。另外,

5、还解释了决策树分类时如何释找最佳分裂指标和确定分裂点豹问题。分裂指标采用了giniindex计算方法,确定分裂点时使雨了CAIM算法对连续登属性进行了离散优处理。模型优化采取了交叉验证和boosting技术,最后给出了预测分褥豹结莱。关键溺:客户滚失;决策捧:聚类;爨步限利;属性獭取;鞠关性分析:CAlM算法:boosting技术西南交通大学硕士研究生学位论文第1I页AbstractCustomer’SfrequentlOSSiSaseriousprobleminthemobiletelecommunicat

6、ionsmarket.Thisproblemwillbedeterioratedwithforeigntelecomcompanies’coming.Inordertocombatthehighcostofchurn,thethesisgivesafeasiblesolution:first,buildapredictionmodelforcustomer’Schurnemployingdataminingtechnology;then,usethemodeltoanalyzewhycustomerschur

7、nandwhichcustomersareUlOStlikelytochurninthefuture;finally,makebettertargetrecruitmentcampaignsbysummarizingcustomer’Scallingbehaviorandhobbytoincreaseretention.Thewholepaperdiscusseshowtobuildthemodelinfourstages:businessquestiondefinition,datapreparation,

8、modelbuilding,modeloptimizationandevaluation.Thefirststageexplainsthequestionsthemodelwillsolveandthegoalsitpursues.Thesecondstagesolvestheproblemssuchashowtoselectdataset,minimize‘‘noise”,normalizevaluesandespeciallyselectattributes.Therearethreemeanstodec

9、reasethenumberofattributes:deleteirrelevantattributestothetaskusingFisher’SDiseriminantRatio;mergecorrelateattributesaccordingtoPearson’SCorrelationCoefficient;reducethedimensionalityoftheattributevect

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。