资源描述:
《基于决策树的数据挖掘技术在电信用户流失预测的应用与研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Technology/Application技术/应用基于决策树的数据挖掘技术在电信用户流失预测的应用与研究□张献华田亮叶幸春中国通信业进入21世纪后,已经从20世的代价自由改变通信运营商,如何保持现存用纪末期的高速增长期进入了一个增长速度相户并挖掘其持久性盈收潜力就成了通信运营对较缓的稳步增长期。一方面,随着有实力的商关注的焦点。国内外运营商通过各种方式不断渗透或加入本文以电信用户流失分析系统为例,具体到通信市场,行业内部竞争日趋白炽化;另一方介绍了从生产数据库中提取数据利用决策树面,消费者面对的移动通信服务选择愈来愈方法进行数据挖掘,建立
2、流失模型,再将分析多,消费者对移动通信业的服务要求也愈来愈数据导入模型进行预测,及时地为电信运营商高,消费者已不再满足简单地能使用电话这一提供挽留决策依据,使电信服务业真正达到以低层次的水平上,更要求在服务功能及服务水用户为中心。平上得到满足。面对如此严峻的环境,电信运营商必须找到一有效的途径吸引新用户,保持决策树分析方法老用户并不断提升用户的利润贡献。同时近年用户流失预测的本质是将用户进行分类,来,随着电信业务迅猛增长,交易处理数据激分类是一种非常重要的数据挖掘方法,分类的增,如此海量的数据背后隐藏着重要信息,电概念是在已有数据的基础上构造
3、出一个分类信运营商期望能发现用户消费习惯与用户地模型,该模型能够把生产数据库中的数据记录区、年龄和性别之间的关系,为制定新业务、个映射到预定义类别中的某一个,从而可以应用性化服务提供参考,预测用户消费趋势变化以于提前预测,实现提前预知用户消费趋势的转期达到吸引新用户保持老户并不断提升用户向点。所谓决策树,就是在对数据进行决策分对企业利润的贡献。类时利用树的结构将数据记录进行分类,其中数据挖掘,也可以称为数据库中的知识发树的一个叶结点就代表符合某个条件的属性现(KnowledgeDiscoveryinDatabase,集,根据属性的不同取值建立
4、决策树的各个分KDD),是从大量的、不完全的、有噪声的、模糊支;随后递归的构造每个子节点的子树。决策树的、随机的数据中,提取出隐含在其中的、人们作为数据挖掘技术中一种分类问题的解决方事先不知道的、但又是可信的、新颖的、有效的法,适用于特征数量较小的高质量分类,并且并能被人理解的信息的高级处理过程。其商业分类结果有很强的解释力度便于认识理解而应用可以描述为:按企业既定业务目标,对大被广泛应用和研究。量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模用户流失分析系统的实现型化的先进有效的方法。(一)分析系统体系结构当
5、前对于一个电信行业这一成熟化的市系统体系结构如图1所示,系统主要由四场,引入一个新用户往往比保持一个现有用户部分构成——生产系统、分析系统、结果展现代价更高,而且在短期内新用户往往比已有用系统、维系挽留系统。根据流失用户定义通过户带来的收益更少,同时现有用户可以用极小接口从生产系统中提取相关数据,在分析系统CHINANEWTELECOMMUNICATIONS79中国新通信技术/应用Technology/Application结果进行反复评估、调整树结构、训练学习,最终维系挽留任务管理营销策略制定选择出最佳的树结构和训练经验值。挽留(三)应用系
6、统的实现1.什么是流失用户(churncustomer)结果流失原因分析离网倾向名单用户属性KPI分析展现流失可分为自发流失,强制流失和预期流失三种。自发流失是用户出于自愿的,决定把他们分生的业务挪到别的地方。强制流失,是公司(而不是析分类边界决策树模型产系规则调整系用户消费记录用户)终止该关系时发现——最常见的原因是欠统统费。当用户不再属于一个产品的目标市场时,预属性简约分类分析数用户缴费记录期流失就会发生,如用户工作地点更换搬迁至其处理据预处理它省份城市。只有区分清楚不同的流失用户,并服务状态记录由不同的部门针对不同的流失用户采用不同的离
7、网用户数据分类分析数据输入接口用户档案记录维系措施,才能真正达到保持现存用户、提升用定义户的持久性并充分挖掘其盈收潜力。在此处我们的流失定义为自发流失和预期流失用户。图1分析系统结构图2.数据抽取与属性简约中进行相关分析建立预测模型,结果展现系统分根据流失用户的定义,从生产系统数据库中为三个部分——根据已有数据进行模型的测试抽象出与用户流失相关的属性,从而建立模型。得出流失原因分析并生成流失用户KPI指标生生产数据库中每位用户的信息主要包括用户基成以及利用预测模型进行离网倾向用户名单的本信息,用户账务信息和客服信息,每种信息都生成,用户根据提
8、供的结果进行决策支持,制定是由一系列用户属性构成。为了使分类模型更具出挽留策略及实施挽留任务管理。可调控性,能输出更具代表性的用户分类,必须(二)项目实施流程用户的