资源描述:
《基于数据挖掘的电信客户流失模型的建立与实现_贾琳》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于数据挖掘的电信客户流失模型的建立与实现贾琳李明(甘肃工业大学电气工程与信息工程学院,兰州IF""H")(D4@.3:*.4*/@.J-KA3.=F$A*@$)+*$=)摘要文章介绍了利用数据挖掘技术处理电信行业中的客户流失问题,包括建立客户流失预测模型的过程及对模型的评价,并且使用数据挖掘工具&’&L(0实现了整个建模过程。关键词数据挖掘客户流失模型&’&系统文章编号%""!DMFF%D(!""#)"#D"%MHD"F文献标识码’中图分类号N1F%%$%F!"#$#%&’(%)’*+*,-./)*0#123".1+4*5#&6%/#5*+748’%9’+9’4’+:(293
2、3+7+9G(3+=*,.=@3@);5)G9,4@*.9)()7.)++,.)7,O@)/KP).>$9GN+=Q$,R@)SQ9KIF""H");)1%3):5)*Q./-@-+,,@)@--3.=@*.9)9G;@*@4.).)7./.)*,9;K=+;,:Q.=Q;+@3.)7:.*Q*Q+-,9A3+49G=K/*94+,,+*+)T*.9).)*+3+=94.);K/*,?,.)=3K;.)7*Q+-,9=+//9G49;+3.)7@);*Q+@//+//4+)*,@);.*@3/9,+@3.S+/*Q+49;+3.)&’&/?/*+4$=#>?*15/:<@*
3、@4.).)7,2K/*94+,D=QK,),&’&/?/*+4%引言进行数据挖掘时,从企业数据中选取有代表性、真实、完整目前,随着电信体制改革的深化,电信业内运营商之间的和有效的,并且和要研究的问题相关的数据子集进行研究。竞争也日趋激烈,在行业中获得一个新客户的开支越来越大,(!)(E-39,+D数据分析和预处理因而保持原有的客户的工作也越来越有价值。电信企业保存着对采样数据集进行分类和筛选,分析各因素之间的相关客户的相关信息,呼叫数据及计费等大量的数据,如何正确地性、数据的规律和趋势等,可以通过图表、曲线等形式表现。分析利用这些数据发现有用的知识,向用户提供更好的服务,(F
4、)09;.G?D数据调整和技术选择从而提高客户的忠诚度,防止客户流失(转向其他的运营商)成明确要解决的问题,在此基础上对数据进行修改。为电信企业关注的首要问题。(#)09;+3D模型的建立和知识的发现数据挖掘就是从大量的数据中自动获取有用信息和知识这一步是知识挖掘工作的中心环节,根据数据集的特征和的过程,它可以把企业分散的数据集中起来获取所需的知识,要实现的目标,选择一种或者几种挖掘方法,如回归分析、决策因此非常适用于电信这样的数据密集型行业。使用这种技术可树等,通过比较获得效果最好的模型。以针对电信企业建立有关客户流失的预测模型,从而分析出客(H)’//+//D模型和知识的综
5、合解释、评价户流失的主要原因并且采取相应措施有效地挽留有流失倾向将以上处理得到的结果和模型进行综合的解释,并且根据的客户。一定的方法,对决策支持信息的适用性做出评价,从而对样本当前市场上比较成熟的数据挖掘工具包括&’&()*+,-,./+数据和模型进行检验,确定是否有必要从新进行挖掘过程。0.)+,,&1&&23+4+)*.)+,5605)*+33.7+)*0.)+,等,在文中采用整个挖掘过程可以用图%表示如下:了&’&系统来实现客户流失模型,并且讨论了模型实现过程,对模型结果进行评价。!数据挖掘的应用步骤数据挖掘又称数据库中的知识发现(8)9:3+;7+<./=9>+,?.)
6、<@*@A@/+,8<<),使用这种技术不但能够学习已有的知识,而且能够使用发现的模式进行预测,从而得到能为人理解并且便于应用的知识,因此该技术得到越来越多的重视。目前数据挖掘已经广泛应用于营销、银行、保险、交通、电信、医疗及故障诊断等许多领域,并且带来了可喜的经济效益。数据挖掘大致经过取得数据源,数据预处理,构造和训练模型及评价模型几个过程,具体步骤如下,即&(00’挖掘过程B%C:(%)&@4-3+D数据采样图%&(00’数据挖掘流程基金项目:甘肃省自然科学基金资助项目(编号:U&"!!D’!HD"FH)计算机工程与应用!""#$#%MH%客户流失模型的建立和实现允许用户比
7、较不同模型并且利用评估结点选择其中最合适的。客户流失模型需要完成以下功能:在客户流失模型中采用了<>@+,)+-回归,神经元网络两种方法(&)分析流失客户的特征,导致客户流失的因素及流失客建模,<>@+,)+-回归模型结果如图!所示,神经元网络建立模型户在这些因素上的分布情况。如图%所示。(!)得出潜在的流失客户群。在模型的建立和实现过程中,采用了’(’系统,’(’系统全称’)*)+,)+-,(.*/0,+,’0,)12,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于&345年成立了’