欢迎来到天天文库
浏览记录
ID:35066620
大小:3.26 MB
页数:69页
时间:2019-03-17
《基于标签传播的半监督多标签学习》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号TP391.4密级公开UDC004.93学位论文编号D-10617-308-(2016)-02047重庆邮电大学硕士学位论文中文题目基于标签传播的半监督多标签学习英文题目Semi-SupervisedMulti-LabelLearningBasedonLabelPropagation学号S130201050姓名卢影学位类别工学硕士学科专业计算机科学与技术指导教师王进教授完成日期2016年4月18日重庆邮电大学硕士学位论文摘要摘要近年来,弱标签(WeakLabel)问题逐渐成为多标签学习领域的研究热点。
2、一般来说,训练数据大量存在且标签完整,是保证多标签学习较好性能的前提。然而,由于在现实应用中数据规模大、标签种类多、标记工作繁重等可能原因,获取的训练数据数量少且标签不完整。给出部分或不完整的标签,预测标签的完整集合(即预测丢失的标签)问题,被定义为“弱标签学习问题”。半监督学习方法将标签传播算法引入多标签学习,以应对实际应用中已标记数据数量较少的情况,并利用大量存在的未标记数据提高算法性能。然而在处理弱标签数据时,半监督学习仍存在一定不足。因此本文针对弱标签问题,对基于图的半监督学习方法进行改进。通过多组
3、公开多标签数据集上的分类实验,验证了改进算法的有效性。本文研究工作主要如下:1.结合聚类算法,针对弱标签数据构造了基于k均值的相似度矩阵。弱标签数据中每个样本对应多个标签,样本间的相似度关系着弱标签样本标签补全的程度。标签传播算法需要事先构造图,图中边的权重大小决定标签的传播程度。边权重度量方法仅靠样本特征之间的欧式距离确定,过于局部。因此本文利用样本聚类信息,调整弱标签样本的相似度矩阵。2.为了应对弱标签数据集的分类问题,本文将多标签学习与基于图的学习方法结合,并对标签传播的过程进行改进,提出了基于弱标签
4、的标签传播(LabelPropagationBasedonWeakLabel,LPWL)方法。由于弱标签数据集的特性,不仅要填充未标记数据的标签,还要补全已标记样本中的缺失标签。LPWL方法利用标签传播补全样本标签,并充分利用弱标签数据提升分类效果。通过在多组数据集上不同弱标签率下的对比实验,验证了本文方法能有效提升对弱标签数据集的分类效果。同时,本文对不同标签率下的数据集进行对比实验,进一步分析了弱标签率给多标签数据分类带来的影响。关键词:弱标签,多标签学习,半监督学习,标签传播I重庆邮电大学硕士学位论文
5、AbstractAbstractWeaklabellearningisbecomingaresearchfocusinthefieldofmachinelearninginrecentyears.Thepreconditionofbetterperformanceinthetraditionalmulti-labellearningisthesheervolumeoftrainingdataandthefulllabeloutthere.However,trainingdatausuallybesmalls
6、izeandincompletelabelwhichmaybeduetolargescale,varietylabelandheavyworkinthepracticalapplication.Givenapartialorincompletelabel,acompletelabelsetprediction(i.e.,themissinglabel)problemisdefinedastheproblemofweaklabellearning".Throughintroducinglabelpropaga
7、tionalgorithm,semi-supervisedlearninginthesmallsizelabeleddata,usinglargenumberofunlabeleddatatoimprovethealgorithmperformancerespondtotheactualapplication.Butsemi-supervisedlearningisinsufficientwhendealingwithweaklabeldatasets.Weimprovethemethodbasedongr
8、aph,makingitsuitableforweaklabeldatasets.Theexperimentsonopenmultiplegroupmulti-labeldatasets,verifiedthevalidityoftheimprovedalgorithm.Themainworkisasfollows:1.Eachsampleinweaklabeldatacorrespondingtomoretha
此文档下载收益归作者所有