欢迎来到天天文库
浏览记录
ID:35187590
大小:4.58 MB
页数:55页
时间:2019-03-21
《集成学习方法及其在通信行业中用户流失分析的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Sou化ChinaUniversitofTechnoloygy|■硕±学位论文1集成学习方法及其在通信行业中I用户流失分析的应用II2..作者姓名黄淳瑶I%学科专业概率论与数理统计I指导教师朱锋峰副教授j巧在学院数学学院!论文提交日期2016年5月!■II'社-.;I--V::I^'I.-..片.!-*人一、’fEnsembleLearningMethodanditsApplicationinTelecom
2、ChurnPredictionADissertationSubmittedfortheDegreeofMasterCandidate:HuangChunyaoSupervisor:AssociateProf.ZhuFengfengSouthChinaUniversityofTechnologyGuangzhou,China分类号;021学校代号:10561学号:201320121028华南理工大学硕±学位论文集成学习方法及其在通信行业中用户流失分析的应用作者姓名:黄淳瑶指导教师姓名、职称:朱锋峰副教授;理学硕i学科专业名称申
3、请学位级别:概率论与数理统计研究方向:数理统计与经巧信息管理论文提交日期=%/若年月4日论文答辩日期:年主月日学位授予单位;华南理工大学学位授予日期:年月日答辩委员会成员:丰席:防化伟J.兰委员:/聲叫华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加[^^示注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均己在文中站明确方式标明。本人完全意识到本声明的法律后果由
4、本人承担。■作者签名:為暖蒼日期;年i月巧日学位论文版权使用授权书目本学位论文作者完全了解学校有关保留、使用学位论文的规定,P;研究生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校有权保存并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅(除在保密期内的保密论文外);学校可W公布学位论文的全i>、、部或部分内容,可允许采缩或其它复制保存汇编学位^^用影印印手段一。论文。本人电子档的肉容质论文的内容相致文和纸;本学位论文属于□密,在年密权。铅解后适用本授书口上,生和学有共享协议
5、不保密,同意在校园网发布供校内师与校.电志狂的单位浏览意将本人学位论文提交中国学术期刊(光盘版)子杂;同CNKI,全文出版和编入《中国知识资源总库》传播学位论文的全部或部分内。容""V请在[^^上相应方框内)(打.主:襄;獻,作者签名请日期叫J',0,|z^.::乂.i日指导教师签名期/y^|'::作者联系电话电子邮箱地:联系址(含邮编)摘要分类器集成技术是机器学习与模式识别领域的一个重要研究方向。由于集成分类器往往能获得比单个分类器更好的性能,因此引起了广泛的重视。已有的研究表明,集成分类器的性能与以下三个方
6、面有关:(1)基分类器的识别性能;(2)基分类器的差异性;(3)分类器的组合策略。本文根据对已有的两种算法的研究,提出了一种改进的集成学习方法——DELMBR。该方法利用Bootstrap抽样技术抽取样本,并对抽取出来的样本的部分属性添加与属性均值有关的扰动作为基分类器的训练数据集。对于训练得到的一系列候选基分类器,采用弹性网正则化的最小二乘损失目标来获得基分类器的权重。这一改进算法具备三个优势:在基分类器的识别性能方面,采用交叉验证误差作为选择参数的标准,使得最终确定的基分类器都具有较好的识别性能;在基分类器的差异性方面,利用Bootstrap抽样方法
7、抽取数据并对数据的部分属性添加随机扰动作为基分类器的训练数据集,因此训练得到的基分类器具有较大的差异性;在基分类器的组合策略方面,采用弹性网正则化的最小二乘损失目标来获得基分类器的权重,这能够使得基分类器的权重稀疏,从而剔除掉对集成贡献较小的基分类器,同时还让基分类器的权重向0收缩,使得最终集成系统较稳定。最后,针对通信行业用户流失预测问题,基于Bagging算法、Adaboost算法以及本文提出的DELMBR算法分别建立流失预测模型,实验的结果显示,基于DELMBR算法的流失预测模型,更适用于这一应用背景。我们以交叉验证结果进行说明:与Bagging算
8、法相比,DELMBR算法交叉验证得到的查准率、查全率以及模型的准确度分别提高了3
此文档下载收益归作者所有