数据挖掘论文70915

数据挖掘论文70915

ID:14239574

大小:461.00 KB

页数:8页

时间:2018-07-27

数据挖掘论文70915_第1页
数据挖掘论文70915_第2页
数据挖掘论文70915_第3页
数据挖掘论文70915_第4页
数据挖掘论文70915_第5页
资源描述:

《数据挖掘论文70915》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、滨江学院题目基于数据挖掘的客户流失问题院系计算机系专业班级软件工程学生姓名许燕学号20082344908指导教师闫雷鸣二O一一年五月二十六日基于数据挖掘的客户流失问题摘要:在营销手段日益成熟的今天,我们的客户仍然是一个很不稳定的群体,因为他们的市场利益驱动杠杆还是偏向于人、情、理的。如何来提高客户的忠诚度是现代企业营销人一直在研讨的问题。关键词:客户流失,数据挖掘,决策树,聚类引言:客户的变动,往往意味着一个市场的变更和调整,一不小心甚至会对局部(区域)市场带来致命的打击。这个现象在医药企业的处方产品中突显,一个医院

2、由一个代表做到一定的销售量,但是这个医药代表离开后,那么销量的下滑是很明显的。如果你是公司的管理者,请务必在关键时刻擦亮你的眼睛,以免你的客户在不经意间流失,给公司的市场运作带来不利影响。当然,这其中的因素和地区的主管、经理也有很大的直接关系。所以,我们通过数据挖掘来分析数据挖掘问题。我们也可以对比已有的方法发现不足之处,然后进行改进。一、数据挖掘数据挖掘又称数据库中的知识发现,是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程,这些模型和关系可以用来做出预测。数据挖掘实施的步骤一般包括三个部分数据的准备、

3、模型的建模型验证图数据挖掘的步骤图所示的各个步骤并不是线性的,要取得好的结果就要不断重复这些步骤。在客户流失分析系统中,数据挖掘只是一小部分,却是关键的一个部分,系统中把数据挖掘得到的知识和市场的经验、客服的信息结合起来,应用于数据库中的数据进行流失客户的预测、分析,对确认有流失倾向的客户根据不同的情况进行预苦处理,包括套餐资费调整、服务方式更改、竞争对手调查等,同时将预誓客户名单通过公司的数据交换平台下发给各个业务分区,进行摸底跟踪,实施关怀工程。整个系统的业务流程如图所示,其中流失客户的预测和分析是两个关键的环节

4、,需要选择讨,实用案例,计算机系统应用年第期合适的数据挖掘算法,获取有用的模型和知识应用于系统中,才能进行科学的辅助决策。二、数据挖掘在系统中的应用流失又分为被动流失和主动流失,被动流失是因为客户欠费或不履行责任而被移动停机。主动流失有不同的原因,一类是客观原因限制所引起的异动,如搬迁等,另一类是客户主动放弃,如因为竞争对手的优惠政策,对目前的服务不满意等。在这些群体中,那些主动流失的客户是我们要分析的对象,在这类群体中,用户价值和信用度高的可能流失客户是我们最关心的对象,如果能够成功预测出这类将要流失的客户,并且能

5、够成功的挽留这类大客户,将给移动公司带来可观的利润。三、基于数据挖掘的电信客户流失分析步骤1、商业理解商业理解是从业务角度来理解数据挖掘的目标和要求,再转化为数据挖掘问题。本文的目标确定为:针对目前在网客户进行流失概率的预测。电信领域的客户流失有3方面的含义[3]:一是指客户从本电信运营商转往到其他的电信运营商;二是指客户使用的手机品牌发生改变,从本电信运营商的高价值品牌转向低价值品牌;三是指客户月平均消费量降低,从高价值客户成为低价值客户。在以上3类客户流失中,第一类是客户流失分析的重点,本文将第一类作为分析的对象

6、。而在第一类客户中,又可具体将其分为被动停机3个月、主动退网和注销用户。2、数据理解。数据理解包括收集原始数据、数据描述、数据探索分析和数据质量描述。(1)收集原始数据当进行数据挖掘时,首先要从企业数据仓库中取出一个与要搜索问题相关的数据子集。该问题的数据来源是某电信公司某年度1月~7月在某地区的数据。(2)数据描述信息类别数据源时间窗口流失自然用户属性相关行为信息属性在网自然用户属性相关行为信息属性USER_BASIC_INFOUSER_BEHAVIOR_INFOUSER_BASIC_INFOUSER_BEHAVI

7、OR_INFO某年7月某年1月、2月、3月某年7月某年7月某年4月、5月、5月、6月某年7月(3)数据探索分析。在使用收集到的原始数据之前,必须要保证所有数据在数量和质量上符合要求。在数据探索阶段,对获取的各变量进行分析探索,选择对目标变量的影响相对较大的关键变量。此处,通过可视化的方式来展现,即利用Clementine中的分布图节点展示用户流失状态在每个变量上的分布图。从各分布图得出,用户的自然属性,例如性别、年龄等信息缺失值比较多,且存在较多的非法数据,所以在本文的分析中,不选该类变量,该类变量不参与建模。另外,

8、像通话次数、通话时长等变量和客户流失概率之间存在着反比关系,即该类变量的值越大,则客户流失的概率相对来说就越小,所以在接下来的分析中,应该将该类变量或与该类变量相关的导出值作为分析的重点。通过上面对样本数据变量的数据探索工作,对各变量属性有了基本的了解,可以有针对性地选择适用变量或对一些变量进行过滤。3.数据准备。数据准备阶段初步完成变量的选择

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。