资源描述:
《数据挖掘在客户流失分析中的应用——聚类与分类算法的研究及应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、数据挖掘在客户流失分析中的应用——聚类与分类算法的研究及应用江苏科技大学硕士学位论文数据挖掘在客户流失分析中的应用??聚类与分类算法的研究及应用姓名:陈光宇申请学位级别:硕士专业:计算机应用技术指导教师:苏勇20070115摘要摘要随着电信市场的逐渐放开,电信企业之间对客户的争夺将越来越激烈。由于电信市场日趋饱和,获取新客户的成本比留住现有客户要昂贵得多。因此,如何尽可能将现有客户尤其是高价值客户保留在自己的网上成了各运营商的工作重点之一。通过建立客户离网模型,使企业能根据对以往离网客户的消费情况进行分析,找出即将离网客户的
2、特征,及时采取相应的措施,减少客户离网的发生。因此,客户流失分析研究对企业降低运营成本,提高经营业绩有着极为重要的意义。本文的应用背景为南京市网通小灵通用户,取2005年1月至2005年6月的数据进行分析。首先对原始数据进行预处理,采用遗传学习方法结合评估函数,可以得出最具代表性的属性集。其次对客户进行细分,采用改进的聚类算法实现,不需要输入初始聚类中心和聚类数目,该算法可以动态地得到聚类结果。本文主要的工作集中在客户流失预测模型的建立,采用了一种基于遗传算法的数据分类方法对客户数据进行建模。首先在训练数据集上运用ID3算法
3、,产生若干分类规则集,由这些分类规则集作为初始种群,利用遗传算法的全局寻优能力,找到最佳分类规则集。将此分类规则应用到将要预测的数据集中,即可得到哪些客户有流失趋势。关键词:数据挖掘;客户流失;决策树;聚类算法;遗传算法ⅠAbstractAbstractAlongwiththeopenoftelecommarket,thecontestsforcustomersaregettingmoreandmoredrastic.Asthesaturationofthetelecommarket,thecostofgettinganew
4、customerismuchhigherthanmaintaininganoldcustomer.So,howtokeepthecustomers,especiallythevaluablecustomers,cametooneofthemostimportantworksforthetelecomcompanies.Buildingthemodelofthechurnuserswillallowthecompanytoanalyzetheconsumecharactersofthosechurneduser,tofindo
5、utthosecustomerswhoaregoingtochurn,sototakeactionsintime.SothestudyofthistopichasveryimportancesignificanceforreducingthecostofrunningthecompanyandtoimprovetheoutstandingachievementofthecompanyInthisthesis,authoranalyzesNanjingNetcomCompany’sPHScustomers.Thedataisf
6、romJanuary2005toJune2005.First,dealingwiththeoriginaldata.Applyinggeneticalgorithmandevaluationfunction,authorcangetthebestrepresentativeattributesetSecond,partitionthecustomers.Applyinganimprovedclusteringalgorithmbasedonpartition,authorneednotinputinitialpartitio
7、nsandinitialvalues.ThenumbersofpartitionsarechangedduringclusteringThemajortaskinthisthesisistocreateacustomerschurnmodel.Themodelisaccordingtoamethodofdataclassificationbasedongeneticalgorithm.First,applyingID3algorithminthetrainingdatasetsandconstructingfull-clas
8、sificationrulesets.Then,usinggeneticalgorithm,authorcangetthebestfull-classificationruleset.Theclassificationrulesareappliedinthedatathatwillbepr