欢迎来到天天文库
浏览记录
ID:35059706
大小:7.05 MB
页数:65页
时间:2019-03-17
《基于主动学习的多示例多标签学习算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、?、、广东工业大学硕±学位论文(工程硕±)基于主动学习的多示例多标签学习算法硏究李杰龙???-'■--。’.;.-—一.‘‘.。.,.-■'''.y--乂-././1'/'V.;-r.''r.-二o—六年五月.-?'.1.'■‘典-I''■-.^y.-:.户I;六学校代号分类号::1巧45UDC;密级;学号:2。。化067广东工业大学硕±学位论文(工
2、程硕±)基于主动学习的多示例多标签学习算法研究李杰龙校内导师姓名、职称:肖燕珊副教授校外导师姓名、职称:卢宇高级工程师学科:(专业)或领域名称计算机技术学生所属学院;计算机学院—论文答辩日期;二〇六年五月ADissertationSubmited化GuangdongUnive巧itofTechnoloforygytheDereeofMastergMasterofEngineerin(g)Resea--rchonMultiinstance
3、MultilabelActiveLearningAlgorithmsCandidate;LiJielongSupervisor:XiaoYanshanMa20y化SchoolofComputerScienceandTechnologyGuangdongUniversityofTechnologyGuangzhou,Guangdong,P.R.China,510006摘要摘要随着互联网的快速发展,,数码产品的快速普及网页文本和图
4、像信息呈爆炸式增一长,数据的大小和数据的结构复杂度也在不断提赢这些数据往往不具有唯的语义一>,语义的学习框架难1而是多义性的。由于这样的多义性使得当前只考虑单[^取得良好的效果一。多示例多标签学习解决的是真实世界中对象多义性问题的种学习框架,真实世界中的对象可W很容易采用多示例多标签学习来进斤建模,多示例多标签学习也成为近年来新的研巧热点。在海量的数据中,面对少量有标签数据和,仅有少量的数据是具有标签和描述的一大量无标签数据,主动学习能够在分类器学习的过程中,根据定的选择策略,迭代
5、,并置入训练集中进行学习主动地选择对分类器性能改善最大的样本进行标注,从而有效地提高了样本训练的效率。在同等条件下,使用更少的有标签样本,达到更高的分类精度,改善分类器的性能。本文首次把主动学习应用到多示例多标签学习框架上,提出了多示例多标签主动学习框架,yA及研。本文首先介绍了相关的学习算法巧了多示例多标签学习的退化策略和主动学习的样本选择算法。然后结合多示例多标签学习的特点,把多示例多标签学习退化到多个单标签的多示例学习。针对多个分类器,我们利用标注样本和未标注一样本的信
6、息,提出种衡量分类器的评价标准分类器可信度classifierconfidence。()根据多示例单标签学习的特点,我们把主动学习应用到其中,并引入两种不同级别的多示例学习算法作为我们的分类器模型一一,提出了两种分类距离标签最小分类距离(labelnrinimum出stance)和标签平均分类距离(labelaveragedistance)。在此基础上,我们设计了四种不同的主动学习样本选择策略算法。最后,我们将模型应用到自然场景一图像分类和文本分类中,实验结果表明般的样本随机选择策
7、略,本文提出的方法与对比,在训练样本相同的情况下,本文提出的方法在各项评价指标中能够获得更好的分类性能。关巧词:主动学习;多示例多标签学习;自然场景分类;分本分类IAbstractAbstractWiththerapiddevelopmentoftheInternetandtherapidspreadofdigitalproducts,thetextandimaeinformationinthewebaesrowsexlosivel.
8、Thestructuralcomlexitgpggpypy’anddatasizealsocontinues化increase.Thisdataoftendoesnthavetheonlysemanticmeaningbutalsomultilesemanticmeaninsandambiuous.Hiisambiuitymakesa
此文档下载收益归作者所有