欢迎来到天天文库
浏览记录
ID:30868374
大小:169.25 KB
页数:9页
时间:2019-01-03
《数据挖掘论文02588》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、扭、池球務滨江学院题目基于数据挖掘的客户流失问题院系计算机系专业班级软件工程学生姓名许燕学号20082344908指导教师闫雷鸣二0—一年五月二十六日基于数据挖掘的客户流失问题摘要:在营销手段口益成熟的今天,我们的客户仍然是一个很不稳定的群体,因为他们的市场利益驷动杠杆还是偏向于人、情、理的。如何来提高客户的忠诚度是现代-企业营销人一直在研讨的问题。关键词:客户流失,数据挖掘,决策树,聚类引言:客户的变动,往往意味着一个市场的变更和调整,一不小心甚至会对局部(区域)市场带来致命的打击。这个现象在医药企业的处方产品屮突显,一-个医院由
2、一个代表做到一定的销售量,但是这个医药代表离开麻,那么销量的下滑是很明显的。如果你是公司的管理者,请务必在关键时刻擦亮你的眼睛,以免你的客户在不经意间流失,给公司的市场运作带來不利影响。当然,这其中的因素和地区的主管、经理也有很大的直接关系。所以,我们通过数据挖掘来分析数据挖掘问题。我们也对以对比已有的方法发现不足之处,然后进行改进。一、数据挖掘数据挖掘又称数据库屮的知识发现,是一个利用各种分析工具在海最数据中发现模型和数据间关系的过程,这些模型和关系可以川來做出预测。数据挖掘实施的步骤一般包括三个部分数据的准备、模型的建模型验证图
3、数据挖掘的步骤图所示的各个步骤并不是线性的,要取得好的结果就要不断重复这些步骤。在客八流失分析系统中,数据挖掘只是一小部分,却是关键的一个部分,系统中把数据挖掘得到的知识和市场的经验、客服的信息结合起来,应用于数据库中的数据进行流失客户的预测、分析,对确认有流失倾向的客户根据不同的情况进行预苦处理,包括套餐资费调整、服务方式更改、竞争对手调杳等,同时将预誓客户名单通过公司的数据交换平台下发给各个业务分区,进行摸底跟踪,实施关怀工程。整个系统的业务流程如图所示,其中流失客户的预测和分析是两个关键的环节,需要选择讨,实用案例,计算机系统
4、应用年第期合适的数据挖掘算法,获取有用的模型和知识应用于系统中,才能进行科学的辅助决策。二、数据挖掘在系统中的应用流失又分为被动流失和主动流失,被动流失是因为客户欠费或不履行责任而被移动停机。主动流失有不同的原因,一类是客观原因限制所引起的异动,如搬迁等,另一类是客户主动放弃,如因为竞争对手的优惠政策,对冃前的服务不满意等。在这些群体中,那些主动流失的客户是我们耍分析的对彖,在这类群体中,用户价值和信用度高的可能流失客户是我们最关心的对象,如果能够成功预测出这类将要流火的客户,并且能够成功的挽留这类大客户,将给移动公司带來可观的利润
5、。三、基于数据挖掘的电信客户流失分析步骤1、商业理解商业理解是从业务角度来理解数据挖掘的冃标和耍求,再转化为数据挖掘问题。本文的H标确定为:针对目前在网客户进行流失概率的预测。电信领域的客户流失有3方面的含义[3]:—是指客户从本电信运营商转往到其他的电信运营商;二是指客户使用的手机品牌发生改变,从木电信运营商的高价值品牌转向低价值品牌;三是指客户月平均消费量降低,从高价值客户成为低价值客户。在以上3类客户流失中,第一类是客户流失分析的重点,本文将第一类作为分析的对彖。而在第一类客户中,又可具体将其分为被动停机3个月、主动退网和注销
6、用户。2、数据理解。数据理解包括收集原始数据、数据描述、数据探索分析和数据质最描述。(1)收集原始数据当进行数据挖掘时,首先要从企业数据仓库中取出一个与要搜索问题相关的数据了集。该问题的数据来源是某电信公司某年度1月〜7月在某地区的数据。(2)数据描述信息类别数据源时间窗口流失自然用户属性相关行为信息属性在网口然用户属性相关行为信息属性USERBASICINFOUSER_BEHAVIOR_INFOUSERBASICINFOUSERBEHAVIORINFO某年7刀某年1刀、2月、3月某年7月某年4月、5月、5月、6(1)数据探索分析。
7、在使用收集到的原始数据之丽,必须要保证所有数据在数量和质量上符合要求。在数据探索阶段,对获取的各变量进行分析探索,选择对目标变量的影响相对较人的关键变量。此处,通过可视化的方式来展现,即利用Clementine中的分布图节点展示用户流失状态在每个变最上的分布图。从备分布图得出,用户的自然属性,例如性别、年龄等信息缺失值比较多”冃存在较多的非法数据,所以在本文的分析中,不选该类变量,该类变量不参与建模。另外,像通话次数、通话时长等变量和客户流失概率Z间存在着反比关系,即该类变虽的值越人,则客户流失的概率相对来说就越小,所以在接下来的分
8、析中,应该将该类变虽或与该类变量相关的导出值作为分析的更点。通过上面对样本数据变量的数据探索工作,对各变量属性有了基木的了解,可以冇针对性地选择适用变最或对一些变最进行过滤。3・数据准备。数据准备阶段初步完成变量的选择和导出变量的生成
此文档下载收益归作者所有