基于最大平衡度与最大共识的改进随机森林算法研究

基于最大平衡度与最大共识的改进随机森林算法研究

ID:35175174

大小:2.64 MB

页数:61页

时间:2019-03-20

基于最大平衡度与最大共识的改进随机森林算法研究_第1页
基于最大平衡度与最大共识的改进随机森林算法研究_第2页
基于最大平衡度与最大共识的改进随机森林算法研究_第3页
基于最大平衡度与最大共识的改进随机森林算法研究_第4页
基于最大平衡度与最大共识的改进随机森林算法研究_第5页
资源描述:

《基于最大平衡度与最大共识的改进随机森林算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP301.6单位代码:10183研究生学号:2013532067密级:公开吉林大学硕士学位论文(学术学位)基于最大平衡度与最大共识的改进随机森林算法研究ResearchonImprovedRandomForestsAlgorithmBasedontheBalanceMaximizationandConsensusMaximization作者姓名:朱琪专业:计算机软件与理论研究方向:数据库与智能网络指导教师:董立岩教授培养单位:计算机科学与技术学院2016年4月未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子

2、版本的任何单位和个人,巧不得对本论文的全部或部分内容进行任何形式的复制、出租、改、修改、发行编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。。否则,应承担侵权的法律责任吉林大学硕女学位论文原创性声明本人郑重声明:所呈交学位论文,是本人在指导教师的指导下,独立进行研究工作所取得的成果。除文中己经注明引巧的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中。臥明确方式标明。本人完全意识到本声明的法律结果由本人承担学位论文作者

3、签名:J日期:2016年月日基于最大平衡度与最大共识的改进随机森林算法研究ResearchonImprovedRandomForestsAlgorithmBasedontheBalanceMaximizationandConsensusMaximization作者姓名:朱琪专业名称:计算机软件与理论指导教师:董立岩教授学位类别:工学硕士答辩日期:2016年月日摘要摘要基于最大平衡度与最大共识的改进随机森林算法研究在过去的几十年中,随着计算机性能的提高、软硬件成本的下降,使得计算机功能日益强大。数据收集和存储设备的大量供应,推

4、动了数据库和信息产业的高速发展,社会各部分信息化程度获得了大步提高。然而,数据量急剧增加的同时,数据背后隐藏的重要知识反而没有得到很好的应用,数据挖掘正是挖掘这些信息的方法。特别是当学习过程中数据所属类别的判断是在用户参与指导下完成的,这就是监督式学习过程。随机森林算法正是监督式学习的一种方法。随机森林算法是一个分类器模型组合算法,思想是机器学习中集成学习算法思想的扩展与应用,其根据训练集学习出多个基分类器,然后综合这些分类结果作为最终的分类结果,提高了集成分类器的分类精度。因为随机森林算法性能优良,在模式识别、文本分类、商品推荐等

5、领域获得了广泛应用。然而,国内研究人员关注的方向主要是随机森林算法在某个具体领域的应用,而关于算法本身性能等的研究则比较少。特别是在大数据背景下,对于随机森林算法的性能和分类精度能否取得进一步提升都研究的不够深入。本文就如何利用随机森林算法处理大数据分类问题展开研究,针对随机森林算法的优化与性能提升,可以从两个方面展开研究,一是从数据预处理方面解决随机森林算法处理非平衡数据集的问题,二是从模型组合这一算法本身的改进方面。一方面,首先分析了非平衡数据集对分类算法带来的问题,总结了常见的数据平衡化方法,并分析各自的缺陷,然后提出一种全新

6、的基于最大平衡度的自适应随机抽样算法,并通过实验证明了该方法的有效性,可以在合理的整体精度范围内能够较好地处理非平衡数据。另一方面,对原有的随机森林算法进行了进一步改造,使用最大共识策略代替原来的多数表决机制,提出了一种新的基于最大共识的模型组合算法,综合考虑模型组合算法的经验误差和泛化误差,用于更好地发挥各个单分类器的个性与优势,强化分类效果好的单分类器的优势,弱化分类效果较差的单分类器的劣势,I摘要并通过实验证明其能进一步提升组合分类器的分类性能,在提高分类精度的同时,也具有较强的泛化能力。关键词:随机森林,模型组合,最大平衡度

7、,最大共识,多数表决,泛化误差IIAbstractAbstractResearchonImprovedRandomForestsAlgorithmBasedontheBalanceMaximizationandConsensusMaximizationInthepastfewdecades,withtheimprovementofcomputerperformanceandthedeclineinthecostofhardwareandsoftware,computerisbecomingmoreandmorepowerful.Th

8、edatacollectionandthelargesupplyofstoragedevices,helptopromotetherapiddevelopmentofdatabaseandinformationindustry.And

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。