欢迎来到天天文库
浏览记录
ID:34633253
大小:1.62 MB
页数:61页
时间:2019-03-08
《基于数据挖掘的电信客户离网预警分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于数据挖掘的电信客户离网预警分析TheAnalysisonWarningofTelecomCustomerChurnUsingDadaMining学科专业:管理科学与工程研究生:张臻指导教师:林盛教授天津大学研究生院2013年11月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得天津大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名:签字日期:年月日学位论文版权使用授权书
2、本学位论文作者完全了解天津大学有关保留、使用学位论文的规定。特授权天津大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:导师签名:签字日期:年月日签字日期:年月日摘要作为电信运营商的经营分析中一个重要主题,客户离网分析主要任务是基于已离网客户和未离网客户的消费行为等数据,进行数据挖掘以建立客户离网预警模型,并分析离网客户的行为特点,以此为制订市场营销策略的决策依据。本文主要通过基于商业理解、数据理解、数据预处理、模型建
3、立、模型评估和模型部署这一CRISP-DM数据挖掘流程对移动客户进行了离网预警研究。首先对客户离网进行定义,继而对比logistic回归、决策树、最近邻分类器、贝叶斯分类器、神经网络、支持向量机和组合分类器等预警分析领域常用的分类算法的主要特点。在此基础上,选取了天津移动公司2012年10月到12月的客户消费和行为数据,建立预警模型对其2013年1月是否在网进行了预测。通过对比七种预警算法的实证分析结果发现:(1)不考虑不平衡类问题的情况下,决策树和组合分类器两种分类算法的效果最好(主要考虑训练集和测试集的误判率),决策树和Adaboost组合分类器的训练集的误判率分别为0.128%和0.2
4、35%,测试集的误判率分别为4.84%和3.87%;(2)支持向量机、神经网络和最近邻三种算法较为耗时;(3)虽然logistic回归模型对分类的依据能作出很好的解释,但其误判率较高;(4)由于所选变量之间有一定相关性,实证分析时发现贝叶斯分类器的误判率比较高。关键词:数据挖掘客户离网预警分类ABSTRACTAsoneoftheimportantbusinessanalysistopicsintelecomoperators’eye,themaintaskofcustomerchurnresearchisdataminingtoestablishapredictionmodelandtoan
5、alyzebehavioralcharacteristicsbaseonthedataofcustomerswhohavechurnalreadyandthosewhoarestillusingoperator’sservices,thusthedecision-makercanformulatemarketingstrategies.UsingtheCRISP-DMdataminingprocess,thispaperbuildapredictionmodelformobilecustomer,whichincludesbusinessunderstanding,dataunderstan
6、ding,datapreparation,modeling,modelevaluationandmodeldeployment.Wedefinescustomerchurnfirstlyandthencomparesevenclassificationalgorithmoftenusedinwarninganalysis,includinglogisticregression,decisiontree,nearestneighborclassifier,Bayesianclassifier,neuralnetwork,supportvectormachinemodelandclassifie
7、rscombined.Basedonthat,weselectthecustomerbehaviordataofTianjinmobileltd.fromOctobertoNovemberin2012,andthenusingtheresultsofmodelstopredictthesecustomerwouldwhetherchurnornot.Comparingtheempiricalresultsof
此文档下载收益归作者所有