欢迎来到天天文库
浏览记录
ID:35189050
大小:7.58 MB
页数:81页
时间:2019-03-21
《基于分步特征选择和组合分类器的电信客户流失预测模型》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、零.尹嗎.画零可夺因钟^若若大赛UniversityofScienceandTechnologyofChina硕±学位论文-^戀:论文题目_甚干4>巧4幸W诛璋和巧合分睾器的—'障,1r;客K束干巧;邸I丰宴型子伟作者姓名徐模式识别与智能系统学科专业琢宗;每^授导师姓名—/\年五月完成时间中通种#接术夫缘硕±学位论文(S)基于分步特征选择和组合分类器的电信客户流失预测模型作者姓名:徐子伟学科专业:模式识别与智能系统副祕名:陈
2、宗海教授-L^m:二o六年五月\^jkUniversitofScienceandTechnolofChinaygyoA’Dissertation化「MastersDereeg@Atwo巧taefeatureselectionmethodgandanensembleclassifierbasedtelecomcustomerchurnredictionpmodel’Au化orsName:ZiweiXuSpeciality:PatternReco
3、nitionandIn化llientSystemsggSupervisor:Prof.ZonhaiChengFinishedtime;Ma2016y,||中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导卞进行研究工作所取得的成果。除己特别加标注和致谢的地方外,论文中不包含任何他人己经发表或撰写过的研巧成果一。与我同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。.^心、6'々作者签名:签字曰期.巧:Xl毛中国科学技术大学学位论文授权使用声明
4、作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权:,即学校有权按有关规定向国家有关部n或机构送交论文的复印件和电子版,允许论文被査阅和借阅A,可y将学位论文编入有关数据库进行检索,可^文采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。。作者签名:导师签名:签字日期0、曰期:?4.签字u乂j摘要巧要随着信息与通信技术的快速发展,电信运营市场日益饱和,运营商之间的竞
5、争日趋加剧一。客户流失预测已成为电信行业重点关注的个问题,进行潜在流失客户的预测分析,及时发现具有较高流失概率的客户,并制定相应的客户挽留策略,对各大电信运营商来讲具有重大意义。本文W电信行业客户流失预测为研巧背景一,旨在构建个高效、准确的电信客户流失预测模型,高效、准确地预测出具有较髙流失概率的客户。本文的主要研究内容与成果如下:1.本文针对电信客户流失数据集中存在的特征维度过髙的问题,对比研巧利用主成分分析、卡方检验和Fisher比率方法进行特征降维所选择的优化特征子集,采用大数据处理框架Spark与Spa
6、rk机器学习库ML/ML1化进行实验,分析不同优化特征子集对朴素贝叶斯、线性支持向量机、逻辑斯蒂回归、决策树和随机森林分类模型预测效果的影响。实验结果表明,不同的特征选择方法所选的优化特征子集对不同分类模型预测效果的影响不同,其中Fisher比率能够选取相对最优的特征子集,并取得较好的预测效果。一2.提出种基于Fisher比率和预测风险准则的分步特征选择方法。本文针对电信客户流失领域特征选择方法存在的问题,结合过滤式和封装式特征选择方一法的优点,提出了种基于巧sher比率和预测风险准则的分步特征选择方法。基
7、于该方法所选的优化特征子集具有较强的判别能力,同时对分类器预測效果影响一。较大实验结果表明,相比于未进行特征选择和基于步特征选择的客户流失预测模型,本文提出的基于分步特征选择方法的客户流失预测模型能够提髙客户流失预测的准确性。一3.提出种基于分步特征选择和组合分类器的客户流失预測模型构建框架。结合Spark机器学习库ML/MLHb,构建基于分步特征选择方法的朴素贝叶斯、线性支持向里机、逻巧斯蒂回归、决策树和随化森林的客户流失预測模型。在此基础上,采用优选组合预测方法从多个分类预满模型中选取预测效果较好的若干
8、分类器。,并采用加权组合所选分类器输出值的方式构建组合分类器实验结果表明一,相对于单分类模型的预測效果,本文提出的基于分步特征选择和组合分类器的客户流失预測模型能够显著提髙流失预測效果
此文档下载收益归作者所有