基于数据挖掘的电信行业客户流失管理研究

基于数据挖掘的电信行业客户流失管理研究

ID:21666295

大小:30.37 KB

页数:5页

时间:2018-10-23

基于数据挖掘的电信行业客户流失管理研究_第1页
基于数据挖掘的电信行业客户流失管理研究_第2页
基于数据挖掘的电信行业客户流失管理研究_第3页
基于数据挖掘的电信行业客户流失管理研究_第4页
基于数据挖掘的电信行业客户流失管理研究_第5页
资源描述:

《基于数据挖掘的电信行业客户流失管理研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、DUFE信息系统研究方法与问题基于数据挖掘的电信行业客户流失管理研究学号:2013100654专业:电子商务姓名:徐麟基于数据挖掘的电信行业客户流失管理研究一、研究背景2008年中国对电信运营企业进行了重组,中国移动和中国联通合并运营TD—SCDMA网络,中国电信与中国联通C网合并运营CDMA2000网络,中国联通G网和中国网通合并运营WCDMA网络,从而形成了移动、电信、联通三足鼎立的局面,电信公司之间的竞争也越来越激烈。对电信企业来说,客户是最重要的资源,也是生存和发展的必需品。客户资源是电

2、信运营企业的根本,保留并巩固客户资源意义重大。而在当前中国电信市场下,电信运营商为了争夺客户,除了通过简单的价格竞争以外,还不断推出各种新的套餐和新的业务来优先获得客户资源,双卡情况越来越严峻,这就在很大程度上加大了客户的不稳定性,使得客户在三家运营商之间不断做出选择的现象频繁发生。据官方统计,中国移动客户的离网率近几年不断攀升,2013年全年离网率高达50%左右。从客户关系管理理论上看,开发一个新用户的成本是保留一个有价值老用户的5-10倍,因此在新增电信客户不断下降的时候,想要保持企业持续增

3、长的利润就需要在挽留老客户这一相对低成本高收益上想办法。二、研究的目的和意义本文的研究目的就是在对电信客户流失等业务知识的理解和研究一些常用的数据挖掘方法上,依据数据挖掘建模流程,研究并实现一个准确实用的的客户流失预测模型和流失客户分类模型,并结合广丰县移动客户数据进行分析,对分析结果进行评估验证。在对客户流失预测模型和流失客户分类模型进行评估和结果分析的基础上,得到了有效的客户流失规则集,并给出预测的准确率,同时依据流失客户分类结果对客户的挽留策略提出一些意见和建议。最后对所做的理论研究工作、

4、实验工作和实验中所遇到的问题以及下一步工作进行总结。三、研究的主要方法和手段1、数据挖掘的定义数据挖掘技术是数据库知识发现的核心技术,产生于二十世纪八十年末,至今大约经历了30年的发展历史,但它的定义却没有一个被完全认同。因为数据挖掘技术被广泛地应用到互联网、电子商务、零售、电信等各个领域在不同的领域应用也不同,因此各专家及学者也分别对数据挖掘进行定义:数据挖掘就是从众多的、不完整的、有杂质的数据中,挖出隐含在里面的、人们以前不清楚的、但又是潜在存在的有用信息的过程。简单地说,数据挖掘就是从众多

5、的数据中找出有用的信息,如图所示,数据挖掘被认为是知识发现过程中的一个步骤。目标定义表达结果和解释数据选择原处理建立模型数据准备图1数据挖掘的过程1、数据挖掘的任务数据挖掘的任务主要是关联分析、聚类分析、分类、预测、时序模式和偏差分析等。(1)关联分析(AssociationAnalysis)关联规则挖掘是由RakeshApwal等人首先提出的。两个或两个以上变量的取值之间存在某种规律性,就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。关联分

6、析的目的是找出数据库中隐藏的关联网。一般用支持度和可信度两个阀值来度量关联规则的相关性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需求。(2)聚类分析(Clustering)所谓聚类[55],就是按照事物的某些属性聚集成类,使得类间的相似性尽可能的小,类间的相似性尽可能的大。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据属性之间的相互关系。聚类分析的算法可以分为以下几大类:分裂法、层次法、基于密度的方法、基于网格的方法和基于模型的方法等。(3)分类(Classific

7、ation)分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类可被用于规则描述和预测。(4)预测(Predication)预测是利用历史业务数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测。预测关心的是精度和不确定性,通常使用预测方差来度量。(5)时序模式(Time-seriesPattern)时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它也是用己知的数据预测未来的值,

8、但这些数据的区别是变量所处时间的不同。(6)偏差分析(Deviation)在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照之问的差别。在本文中需要数据挖掘完成的任务主要是对电信客户流失数据的分类及预测。3、数据挖掘过程模型本文准备采用CRISP-DM模型来进行数据挖掘。CRISP-DM模型定义了6个阶段,分别是:商业理解(BusinessUnderstanding)、数据理解(DataUndersta

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。