【7A文】电信客户流失影响因素与预测分析

【7A文】电信客户流失影响因素与预测分析

ID:47062654

大小:738.49 KB

页数:14页

时间:2019-07-12

【7A文】电信客户流失影响因素与预测分析_第1页
【7A文】电信客户流失影响因素与预测分析_第2页
【7A文】电信客户流失影响因素与预测分析_第3页
【7A文】电信客户流失影响因素与预测分析_第4页
【7A文】电信客户流失影响因素与预测分析_第5页
资源描述:

《【7A文】电信客户流失影响因素与预测分析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、【MeiWei81-优质实用版文档】电信客户流失影响因素与预测分析一、引言目前电信运营商面临着激烈的市场竞争。对电信运营商来说,客户即生命,如何保持现有客户是企业客户管理的重中之重。因此,电信运营商拥有的客户越多,作为主要成本的前期投资就会越大,企业的利润也就越大。客户资源对于电信运营商来说其意义不言而喻,电信运营商之间的竞争实际上就是对客户资源的竞争。可以说,未来的电信行业,得客户者得天下。 当今电信市场竞争激烈,运营商每月客户流失率在1%~3%,挽留将要流失客户,降低客户流失率是近年来热门的研究领域。而数据挖掘技术是解决这一问题的有效途径,本文使用IBMS

2、pssClementine(IBNSPSSModeler)进行数据挖掘与分析,深入了解电信客户流失的关键,以对该类客户的行为特性进行预警分析,采取针对性的措施改善客户关系,避免客户流失或者挽留客户。二、问题分析根据已有的结果——流失客户(在数据中直接有判别数据有没有流失的字段churn),寻找他们流失的原因,即流失客户的特征。通过数据处理,统合数据,根据以前拥有的客户流失数据建立基本属性、服务属性和客户消费数据与客户流失可能性的数据模型,找出其潜在的关系,分析出客户流失的因素,计算出客户流失的可能性,预测客户是否流失的可能性。对于客户的基本数据、客户行为数据及

3、消费数据,进行数据挖掘,研究已流失客户数据,从中找出先前未知的、对企业决策有潜在价值的知识和规则,发掘潜在流失客户,让企业适时把握住市场及客户动态,掌握客户流失的规律。三、算法简介3.1分类分析分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构建模型,一般用规则或决策树模式表示。分类是数据挖掘的主要方法,分类模型能很好地拟合训练样本集中属性集与类别之间的关系,也可以预测一个新样本属于哪一类。分类技术已经在很多领域得到成功应用,如医疗诊断,客户流失预测,信用度分析,客户分群和诈骗侦测。常见的分类方法有贝叶斯分类(Bay

4、esian),神经网络(neuralnetworks),遗传算法(geneticalgorithms)和决策树分类器(decisiontrees)。在这些分类方法中,决策树分类器在大规模的数据挖掘环境中已经获得了最为广泛的应用。3.2决策树演算法决策树演算法是在进行数据挖掘时经常使用的分类和预测方法。一个决策树的架构,是由三个部分所组成:叶节点(LeafNode)、决策节点(Decisionnodes)以及分支。决策树演算法的基本原理为:通过演算法中所规定的分类条件对于整体数据进行分类,产生一个决策节点,并持续依照演算法规则分类,直到数据无法再分类为止。【Me

5、iWei81-优质实用版文档】【MeiWei81-优质实用版文档】3.3决策树演算法的比较决策树演算法依据其演算原理以及可适用分析数据类型的不同延伸出多种决策树演算法。在IBMSPSSModeler中,主要提供了四种常用的决策树演算法供使用者选择,分别为:C5.0、CHAID、QUEST以及C&RTree四种。使用者可依据数据类型以及分析需求的不同,选择适当的决策树演算法进行分析。虽然不同的决策树演算法有各自适用的数据类型以及演算架构等差异,但概括来说,决策树的主要原理均为通过演算法所定义的规则,对数据进行分类,以建立决策树。鉴于篇幅所限,以下部分将会针对这四

6、类决策树演算法进行简单的介绍和比较,而详细演算法原理将不会在本文中详述。3.4决策树的几大优点第一,与神经网络和贝叶斯分类器相比,决策树提供非常直观的描述,这种描述易于被吸收,转化为标准的数据库查询第二,训练神经网络模型时要花费大量的时间,要进行大量的重复操作,与之相比决策树效率要高很多,适合于大的训练集。第三,决策树生成算法除了训练集中包含的信息外不需要附加的信息(即领域知识或类标签以前的分布情况)。第四,决策树有着可比的或更高的准确率。在使用决策树演算法进行分析之前,首要工作就是选择适当的演算法。一般来说,会根据所要分析数据的特性以及数据型态等选择初步的演

7、算法。接下来再通过比较初步筛选的决策树分析出来的结果,选择最适合的决策树演算法。一、实验与分析4.1数据准备数据来源:电信客户流失数据.sav(共有8个字段,1000个记录)数据有8个字段,其中包含一些客户个人信息,例如年龄、教育程度、退休、性别和客户类别, 还包含一些客户使用电信服务信息(有附加服务、基本服务、上网服务和所有服务)以及客户的上网月数,(这里老师我不会把sav格式转换成GlsG格式的,所以用的还是原来的那个1000个记录的,(但是我把样本抽样选择了前200了,由于我用前200的样本数据进行数据挖掘,发现挖掘出来的结果完全失去了真实性,与现实不符

8、合,所以我还是将数据样本量改成了100

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。