集成学习方法及其在通信行业中用户流失分析的应用

集成学习方法及其在通信行业中用户流失分析的应用

ID:35187590

大小:4.58 MB

页数:55页

时间:2019-03-21

集成学习方法及其在通信行业中用户流失分析的应用_第1页
集成学习方法及其在通信行业中用户流失分析的应用_第2页
集成学习方法及其在通信行业中用户流失分析的应用_第3页
集成学习方法及其在通信行业中用户流失分析的应用_第4页
集成学习方法及其在通信行业中用户流失分析的应用_第5页
资源描述:

《集成学习方法及其在通信行业中用户流失分析的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Sou化ChinaUniversitofTechnoloygy|■硕±学位论文1集成学习方法及其在通信行业中I用户流失分析的应用II2..作者姓名黄淳瑶I%学科专业概率论与数理统计I指导教师朱锋峰副教授j巧在学院数学学院!论文提交日期2016年5月!■II'社-.;I--V::I^'I.-..片.!-*人一、’fEnsembleLearningMethodanditsApplicationinTelecom

2、ChurnPredictionADissertationSubmittedfortheDegreeofMasterCandidate:HuangChunyaoSupervisor:AssociateProf.ZhuFengfengSouthChinaUniversityofTechnologyGuangzhou,China分类号;021学校代号:10561学号:201320121028华南理工大学硕±学位论文集成学习方法及其在通信行业中用户流失分析的应用作者姓名:黄淳瑶指导教师姓名、职称:朱锋峰副教授;理学硕i学科专业名称申

3、请学位级别:概率论与数理统计研究方向:数理统计与经巧信息管理论文提交日期=%/若年月4日论文答辩日期:年主月日学位授予单位;华南理工大学学位授予日期:年月日答辩委员会成员:丰席:防化伟J.兰委员:/聲叫华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加[^^示注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均己在文中站明确方式标明。本人完全意识到本声明的法律后果由

4、本人承担。■作者签名:為暖蒼日期;年i月巧日学位论文版权使用授权书目本学位论文作者完全了解学校有关保留、使用学位论文的规定,P;研究生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校有权保存并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅(除在保密期内的保密论文外);学校可W公布学位论文的全i>、、部或部分内容,可允许采缩或其它复制保存汇编学位^^用影印印手段一。论文。本人电子档的肉容质论文的内容相致文和纸;本学位论文属于□密,在年密权。铅解后适用本授书口上,生和学有共享协议

5、不保密,同意在校园网发布供校内师与校.电志狂的单位浏览意将本人学位论文提交中国学术期刊(光盘版)子杂;同CNKI,全文出版和编入《中国知识资源总库》传播学位论文的全部或部分内。容""V请在[^^上相应方框内)(打.主:襄;獻,作者签名请日期叫J',0,|z^.::乂.i日指导教师签名期/y^|'::作者联系电话电子邮箱地:联系址(含邮编)摘要分类器集成技术是机器学习与模式识别领域的一个重要研究方向。由于集成分类器往往能获得比单个分类器更好的性能,因此引起了广泛的重视。已有的研究表明,集成分类器的性能与以下三个方

6、面有关:(1)基分类器的识别性能;(2)基分类器的差异性;(3)分类器的组合策略。本文根据对已有的两种算法的研究,提出了一种改进的集成学习方法——DELMBR。该方法利用Bootstrap抽样技术抽取样本,并对抽取出来的样本的部分属性添加与属性均值有关的扰动作为基分类器的训练数据集。对于训练得到的一系列候选基分类器,采用弹性网正则化的最小二乘损失目标来获得基分类器的权重。这一改进算法具备三个优势:在基分类器的识别性能方面,采用交叉验证误差作为选择参数的标准,使得最终确定的基分类器都具有较好的识别性能;在基分类器的差异性方面,利用Bootstrap抽样方法

7、抽取数据并对数据的部分属性添加随机扰动作为基分类器的训练数据集,因此训练得到的基分类器具有较大的差异性;在基分类器的组合策略方面,采用弹性网正则化的最小二乘损失目标来获得基分类器的权重,这能够使得基分类器的权重稀疏,从而剔除掉对集成贡献较小的基分类器,同时还让基分类器的权重向0收缩,使得最终集成系统较稳定。最后,针对通信行业用户流失预测问题,基于Bagging算法、Adaboost算法以及本文提出的DELMBR算法分别建立流失预测模型,实验的结果显示,基于DELMBR算法的流失预测模型,更适用于这一应用背景。我们以交叉验证结果进行说明:与Bagging算

8、法相比,DELMBR算法交叉验证得到的查准率、查全率以及模型的准确度分别提高了3

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。