基于数据挖掘技术的客户分析研究——决策树分析方法在客户流失中的应用

基于数据挖掘技术的客户分析研究——决策树分析方法在客户流失中的应用

ID:20856441

大小:1.34 MB

页数:51页

时间:2018-10-17

基于数据挖掘技术的客户分析研究——决策树分析方法在客户流失中的应用_第1页
基于数据挖掘技术的客户分析研究——决策树分析方法在客户流失中的应用_第2页
基于数据挖掘技术的客户分析研究——决策树分析方法在客户流失中的应用_第3页
基于数据挖掘技术的客户分析研究——决策树分析方法在客户流失中的应用_第4页
基于数据挖掘技术的客户分析研究——决策树分析方法在客户流失中的应用_第5页
资源描述:

《基于数据挖掘技术的客户分析研究——决策树分析方法在客户流失中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第一章绪论周期价值,以此作为客户分类的依据,针对不同类别的客户采取不同的措施。同样通过客户分析可以预测客户将来一段时期的需求;可以预测客户流失的可能性,或者采取及时的补救措施,或者做出减少不必要的投资等决策,最大限度地保留客户和降低企业的损失。通过客户分析还可以测评客户忠诚度,识别忠诚客户。(2)运用客户分析能帮助企业优化、快速制订客户发展战略。客户分析不但通过对客户知识的直接使用来提高企业面向客户的战术决策能力,而且,在以客户为中心的企业结构的支持下,实施广义上的客户知识管理,最终提高企业客户发展

2、战略和总体战略的有效性和科学性。客户分析是建立在对客户数据的分析、知识发现的基础之上的,它使企业对客户的决策建立在定量的基础上,而不是定性的假设。1.3国内外研究现状及发展趋势国内电信业的发展是近五、六年的事,这段时间内精力集中在抢占市场。技术研究主要是业务运营支撑系统(BOSS)的更新换代,如对计费系统、客户服务系统、财务管理系统的开发与完善。这些系统中保留着大量的客户通话行为数据、账单、投诉咨询和客户基本信息数据。由于电信企业忙于业务扩张,无暇顾及对这些数据的挖掘分析。近一两年来,一些有实力的电

3、信企业考虑到挽留高价值客户的必要才逐步着手对这些历史数据进行挖掘。由于起始的时间不长,大部分都只是试探性地建立简单的模型,有的还处于调研和可行性分析阶段,没有实际投入应用的产品。国外对这一方面的研究起步较早,已经有六、七年的研究时间,某些科研结构己经研究出了较为成熟的模型,投入到了市场应用之中。从市场的反馈来看,这些模型并不具备很强的健壮性,准确率也不是很高,而且随着数据量的激增,对模型的性能开销也越来越大,许多研究机构在设法提出改进的算法来对各种客户分析模型进行优化、完善。同时,由于国内的电信市场

4、与国外的电信市场存在着很大的差异,在将国外的模型应用到国内之前必须进行调整。1.4本课题的研究内容本课题主要研究了客户分析关于客户流失方面的内容:在本课题中我们提出使用基于概念层次的CART分类方法来预测客户流失,并在算法实现中提出使用非递归的构造方法,以节省系统开销。选择这种数据挖掘方法的原因是因为用这种方法得出的模型可以很容易地被人们理解。完成这样一个模型建立过程,本文的完成经历了以下6个步骤:○1问题的理解首先数据挖掘需要业内专家的积极参与,这是使用和预期相符数据从而获得研究4第一章绪论成功的

5、保证。对客户流失的不同种类分别定义业务问题,进而区别处理。此外在分析客户流失时必须区分集团/个人客户,以及不同消费水平的客户,并有针对性地制定不同的流失标准。为此,我们对课题背景进行了深入研究。○2数据的理解客户流失的方式有两种。第一种是客户的自然消亡。第二种是客户的转移流失,通常指客户转移到竞争对手,并使用其服务。第二种流失的客户才是运营商真正关心的、具有挽留价值的客户。因此在选择建模数据时我们慎重选择了第二种流失客户数据(企业关注的数据)参与建模,以建立有效的模型。此外,在建模的时候,尽可能收集

6、完整的数据。○3数据准备数据清洗和预处理是建模前的数据准备工作,一方面保证建模数据的正确性和有效性,另一方面通过对数据格式和内容的调整,使数据更符合建模的需要。数据整理的主要工作包括对数据的转换和整合、抽样、随机化、缺失值处理等等。此外,模型在建立之后需要大量的数据来进行检验,因此通常把样本数据分为三部分,用于生长树的训练样本集,用于修剪树的训练样本集以及用于评价模型的测试样本集。○4建立模型我们使用决策树技术中的CART(分类回归树)算法对上述数据进行挖掘,挖掘过程中考虑到我们关心的是一些基于高层

7、的、概括的规则,并且考虑到算法效率问题所以提出基于概念层次的CART分类算法。并且由于在相同的环境下对于二叉树的生成,递归算法比非递归算法的效率低,所以我们在实现时使用了非递归算法。○5评价模型利用未参与建模的数据进行模型的评估,才能得到准确的结果。检验的方法是使用模型对已知客户状态的数据进行预测,将预测值与实际客户状态作比较,预测正确率最高的模型是最优模型。○6应用模型业务人员应该针对最优模型进行合理的解释。根据模型结果,请业内专家给予利用。根据预测现状,以便能利用它们来具体改善经营活动。在模型应

8、用过程中,可以先选择一年的业务实施预测应用,试验期间随时注意模型应用的收益情况。1.3论文的组织本文组织如下:第一章,绪论部分,我们首先引入客户分析的概念,接着给出了本课题的研究背景及意义,然后简单综述了相关课题的国内外研究现状及发展趋势,最后总括了本文5第一章绪论要完成的工作。第二章,详细介绍了客户分析与数据挖掘的各个方面,以及他们之间的关系。第三章,讨论了数据挖掘中分类的概念及方法,结合本课题分析了各种分类方法,并选定了模型建立方法并提出了衡量模型的几个指标。第四

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。