欢迎来到天天文库
浏览记录
ID:36503682
大小:1.75 MB
页数:53页
时间:2019-05-11
《基于特征变换的协同学习方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、AthesissubmittedtoZhengzhouUniversityforthedegreeofMasterCollaboration—trainingMethodBasedonFeaturern●’J‘lranSlormanonByZhaoWenliangSupervisor:Prof.FanMingComputerSoftwareandTheorySchoolofInformationEngineeringMay2014原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的
2、内容外,本论文不包含任何其他个人或集体己经发表或撰写过的科研成果。对本文的研究作出重要贡献的个人和集体,均己在文中以明确方式标明。本声明的法律责任由本人承担。学位论文作者:.趣支免日期:2014-年5月西日学位论文使用授权声明本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、缩印或者其他复制手段保存论文和汇编本学位论文。
3、本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。学位论文作者:走丈毛日期:2。J牛年5月西日摘要在数据挖掘应用领域(如Web页面分类),收集大量未标记的实例已相当容易,而标记这些实例却需要耗费大量的人力物力。因此在有标记实例较少时,如何利用大量的未标记实例来改善学习性能已成为一个研究热点,半监督学习是其中一种主流学习技术,而协同学习又是半监督学习中有代表的一类算法。协同学习成功的关键在于构建准确而又有差异的基分类器,经典的协同学习算法有Co.Training、
4、Tri.Training、COTRADE等。其中大多数的算法采用自助采样来构建此分类器,而自助采样不能够充分利用全部已标记实例集的信息,加之已标记实例本就特别稀少,使得学习到的分类器很难具有强泛化能力,从而影响了分类器的性能。为了缓解上面提到的问题,本文提出了一种基于特征变换的协同学习方法,选取Tri—Training算法作为代表,将特征变换应用于Tri.Training中。与传统的Tri—Training不同,该方法使用特征变换把全部已标记训练实例集映射到新空间,得到有差异的训练集,从而避免了自助抽样带来的问题。这样做的另外一个原因是:
5、基于特征变换的方法更容易构建准确而又有差异的基分类器。为了充分利用数据集的类分布信息,本文构建了一种新的基于Must.1ink和Cannot.1ink约束集合的特征变换TMC(TransformationbasedonMust—linkconstrainsandCannot.1inkconstrains),并将其用于基于特征变换的Tri.Training方法中。在UCI数据集上的实验结果显示:在不同的未标记比率下,相比于传统的Co.Training和Tri.Training算法,采用基于特征变换的rift.Training算法总是在绝大多
6、数数据集上具有更高的准确率。另外,较之于算法Tri.LDA和Tri.CP,基于TMC的Tri.Training方法表现出更好的泛化性能。关键词:协同学习:特征变换;己标记实例集;准确;差异;自助采样AbstractInthefieldofdataminingapplication(Webpagecategorization),unlabeleddataismucheasytoget,butitwillrequiremuchresourcesforlabelingtheseinstances.Undertheconditionoflacki
7、nglabeledinstances.HowtomakeuseofalargenumberofunlabeledinstancestOimproveperformancehasbecomeahotresearchtopic.Semi-supervisedlearningisoneofthemainstreamlearningtechnologies,andcollaboration—trainingisoneoftherepresentativealgorithms.ThekeytOSuccessisconstructingaccurat
8、eanddiversityclassifiersinthemethodofcollaborationlearning,theclassicalgorithmsincludeCo—Trainin
此文档下载收益归作者所有