结合主动学习的半监督分类算法优化研究

结合主动学习的半监督分类算法优化研究

ID:36606734

大小:7.17 MB

页数:62页

时间:2019-05-12

结合主动学习的半监督分类算法优化研究_第1页
结合主动学习的半监督分类算法优化研究_第2页
结合主动学习的半监督分类算法优化研究_第3页
结合主动学习的半监督分类算法优化研究_第4页
结合主动学习的半监督分类算法优化研究_第5页
资源描述:

《结合主动学习的半监督分类算法优化研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、专业学位硕士学位论文结合主动学习的半监督分类算法优化研究ResearchonOptimizationofSemi-supervisedClassificationAlgorithmCombiningwithActiveLearning学号:曼!!!ZQQ呈完成日期:2Q!墨二Q墨二至墨大连理工大学DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文

2、不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:兰逾至动堂刍敏差曼蟹建起錾速位五幽拉作者签名:———立互良——————一日期:』止年—L月乒日结合主动学习的半监督分类算法优化研究摘要在机器学习领域中,监督学习只考虑有标签数据(Labeleddata),无监督学习只考虑未标签数据(Unlabeleddata),但是现实应用中,两者往往是都存在的,仅

3、仅用稀缺的标签数据不足以训练出性能较好的分类器,而仅仅采用未标签数据又会浪费标签数据中包含的类别信息。近几年来,基于图的半监督学习方法建立在数学理论较为完善的图论之上,受到了国际机器学习和数据挖掘界的高度重视,并取得了很多研究成果。文章先分析了未标签数据对分类决策边界的影响,得出只有在模型假设很好的匹配实际数据时,未标签数据才是有用的。然后以标签传递法引出了基于图的半监督分类方法框架,根据此框架分析了现有的几个经典的基于图的半监督分类算法:高斯随机场与调和函数算法(GaussianRandomFieldandH

4、armonicFunction,GRF)、局部与全局一致性算法(LocalandGlobalConsistency,LGC)等。一虽然基于图的半监督分类方法建立在数据理论较为完善的图论之上,但其本身取得的效果并不尽如人意,对算法的优化处理也是非常有必要的,如构建图的优化、参数学习、已知类比例信息都可以对分类结果做进一步优化。另外,标签数据的匮乏对半监督学习的性能影响非常大,主动学习(ActiveLearning,CohnDA,1996)就是一种能够有效减少算法对标签数据需求量的学习方法。在主动学习中,分类器主动

5、选择信息含量最大的数据(即能最大程度提高分类器性能的数据),而不是随机选择,然后交由外界监督者进行类别标注,再把该数据添加的训练集重新训练分类器。本文将主动学习与两个经典的半监督学习算法结合起来,提出了结合主动学习的调和函数算法(AL.GRF)与结合主动学习的局部与全局一致性算法(AL.LGC)。在UCI提供的MNIST、LETTER手写字体识别数据集上的实验结果表明,与经典基于图算法相比,AL.GRF与AL.LGC算法也取得了更好的分类精度。关键词:基于图的半监督;主动学习;高斯随机场与调和函数;局部与全局一

6、致性基于图的半监督分类算法优化研究ResearchonOptimizationofSemi—supervisedClassificationAlgorithmCombiningwithActiveLearningAbstractInmanytraditionalapproachestomachinelearning,atargetfunctionisoftenestimatedusingeitherlabeleddataorunlabeleddataalone.However,inmanyreal.worldp

7、roblemsitalwaysoccurssimultaneously.Semi—supervisedlearningisaneffectiveapproachtosettlethisproblem.asitcombinesunlabeleddatawithlabeleddatatoimproveabetterclassification.Moreover,semi.supervisedalwaysachieveshi.ghlyclassificationaccuracywithalittlehumanlabo

8、r.Recently,graph-basedsemi·supervisedlearninghasattractedallincreasingamountofinterestrecentlyandseveralnovelapproacheshavebeenproposed.Thearticleanalysestheinfluenceofunlabeleddatatoclassificat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。