欢迎来到天天文库
浏览记录
ID:5252267
大小:29.00 KB
页数:7页
时间:2017-12-07
《流失预测模型设计和实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、流失预测模型设计和实现 【摘要】随着市场竞争的日益加剧,客户流失问题是电信运营商都面临并急需解决的问题。要解决这个问题,首先就要对客户进行分析和预测。本文就是介绍利用挖掘软件SPASSModeler对电信客户进行数据探测与分析,掌握老客户的流失动向,并对流失客户的特征进行归类,为以后电信运营提供有用的数据。【关键词】客户;SPASSModeler数据;流失DesignandImplementationofChurnPredictionModelLinKuan-sheng(StatePressandPublicationAdministrationofRadiostation2022X
2、injiangKashgar844000)【Abstract】Withtheincreasingcompetitioninthemarket,customerchurnproblemisandtelecomoperatorsarefacingurgentproblems.Tosolvethisproblem,wemustfirstanalyzeandpredictcustomer,thisarticleistointroducetheuseofminingsoftwarefortelecomcustomersSPASSModelerdataacquisitionandanalysiso
3、ftrendsinthelossofcontrolandoldcustomers,andthelossofcustomer7characteristicsareclassifiedasaftertelecomoperatorstoprovideusefuldata.【Keywords】customers;spassmodelerdata;outflow1引言在电信行业,每个电信运营商都存在客户流失的问题。通常情况下,获取一个新客户的成本往往远高于维系一个老客户的成本,尤其是客户新增市场越来越稀疏的情况下,减少客户流失就意味着用更少的成本减少利润的流失。如何在海量的数据中提取有效的信息,
4、判断用户流失的倾向,从而做到及时、有效地成功维系和挽留老用户成为电信运营商急需解决的问题。为此,本文利用SPASSModeler数据挖掘工具,进行数据探索,预测在未来一段时间内可能流失的客户,为挽留客户提供明细清单。SPASSModeler数据挖掘的工作流程一般采用CRISP-DM(即“跨行业数据挖掘标准流程”的英文缩写)方法,CRISP-DM是一种业界认可的用于指导数据挖掘工作的方法。具体实施步骤包含商业理解、数据理解、数据准备、建立模型、评估模型、结果部署。2数据处理2.1商业理解7客户流失属于数据挖掘中的分类技术问题,其最终目的是把客户分为两类:一类是具有流失倾向的客户;另一类是
5、无流失倾向的客户。根据对历史流失客户的探讨、分析,总结出具有十分明确的流失客户。以此为依托,提取影响客户流失的动态变量因素和静态变量因素。2.2数据理解模型利用SPASSModeler的统计节点、均值节点、特征节点、直方图、分布图等节点初步确定影响客户流失的变量。2.3数据准备数据准备包含数据选择、分析数据。清洗、缺失值和离群值的处理以及相应的数据转化、离散化、抽样、平衡等。数据选择是数据挖掘的前提条件,主要是确定模型的输入变量。因为并不是所有的客户信息都会对客户的流失产生影响,应尽可能降低数据的复杂度,发掘较高关联度的输入变量。利用SPASSModeler的过滤节点过滤所有与流失模型
6、无关的变量。分析数据包括数据清洗、预处理。主要包括数据抽样、数据转化、缺损、离群值数据处理等,通过抽样节点,完成数据抽样,通过数据抽样降低系统的处理量。7数据转化为了保证数据的质量和可用性。比如对连续型数据变量的离散化、数据变形。例如通话次数,数值分布区间范围非常大,而客户分布又比较集中在中低值范围内,数据的极值标准化,有进一步压缩了数据的聚集。对模型的识别的效果不理想,因此可以采用数据转化的方法,使数据分布更好地接近正态分布,即使最终到不到正态分布,但也使数据分布离散化,同时也能消弱极值的影响。数据审核节点处理缺失值和离群值,根据实际情况可以选择丢弃、转化等操作。3G客户流失率一般在
7、5%左右,如果直接采用决策树、神经网络等模型,可能会因为数据概率太小而导致模型的失效。假设月客户的流失率在5%左右,如果全部将客户预测为正常客户,那么预测的整体精度就高达95%。虽然整体精度很高,但是对流失客户的预测精度却为0%,显然这样的预测结果能体现客户流失预测的真正价值。因此在数据准备这一阶段,数据平衡显得格外重要,我们可以利用SPASSModeler数据挖掘工具中的平衡节点,增加流失客户的比例。实际操作过程中,由于过度抽样带来的负面效应
此文档下载收益归作者所有