欢迎来到天天文库
浏览记录
ID:35180145
大小:4.61 MB
页数:59页
时间:2019-03-20
《基于示例加权支持向量机的多示例学习算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、.广东工业大学硕±学位论文C工学硕±)基于示例加权支持向量机的多示例学习算法硏究张丽阳二〇—六年五月845分类号:学校代号:11UDC;::2。1305041密级学号广东工业大学硕±学位论文(工学硕i)基于示例加权支持向量机的多示例学习算法硏究张丽阳指导教师姓名、职称:郝志峰教授学科(专业)或领域名称:歎件工稱学生所属学院;计黨机学院论文答辩日期—;二〇六年五月ADissertationSubmitedt;oGuandon
2、UnivenitofTechnolofbrggygytheDegreeofMasterasterofEnin说ri打Science(Mgg)-ResearchonMuiBasedonltiInstanceLearnngInstanceWehtedSuortVectorMachineigppCand:anidateZhangLiygSupervisor;Prof.HaoZhifengMa2016ySchoolofComputerSci
3、enceandTechnologyGuangdongUniversityofTechnologyGuanzhouGuandonP.R.China510006g,gg,,摘要摘要随着虹temet的迅速普及,知识和信息的爆炸,人们所面临的数据量急剧増长,各行各业面临着大量的数据处理。这些丰富的数据资源背后,富含着极为重要的、潜在。,的、有用的知识在现实世界的数据中,它们往往可能存在误差例如,属性值的缺一损致等。因此,,数据形式的不合适,数据的重复、弄常、含噪声、不如何从送
4、些数据中获取有效的信息是我们仍需解决的问题。多示例学习最巧的提出是用来解决药物分子活性预测问题,目的是希望能够从大量的分子中提取出更有活性的分子,来帮助制药公司集中有限的资源用于更有意义的。目前,研究,很多经典的多示例学习算法相继提出如基于支持向量机的多示例学习算法、基于神经网络的多示例学习算法、基于决策树的多示例学习算法等,多示例学习框架得到了广泛的研究与应用,己被应用到如药物活牲预测、图像检索、股票预测、物体检测等众多领域。在传统的多示例学习中,训练集由若干个多示例包组成,每个包中包
5、含若干个示一例个正示例,,标签作用于包,而多示例包内的示例没有标签。每个正包至少包含也就是说正包除了含有正示例,还可能包括负示例。另外,负包中的全部示例都是负。示例多示例学习的任务是通过已标记多示例包来学习分类器,并利用其来预测未标记多示例包的标签。本文介绍了支持向量机的相关理论基础,,给出了多示例学习的相关研巧着重介绍了在数据受到噪声干扰的情况下,如何结合多示例学习与支持向量机,降低噪声对分类结果的影响。由于数据收集设备误差、传输偏差等原因,多示例包的示例可能存。在噪声信息在这种情况下
6、,传统的多示例学习可能无法有效地处理多示例包中存在的噪声问题。本文在多示例学习与支持向量机结合的基础之上,通过示例加权,降低噪声示例对分类预测的影响。在实验中,本文使用了藤香分子数据集和基于内容的图,对比了多种经典的多示例学习算法。实验结果证明像检索数据集,本文的方法获得了更高的分类精度。:多示例学习关键词;支持向量机;噪声信息IAbstractAbstractWiththerapiddevelopmentofIntern巧and1:heexplosionofin
7、formation,theamountofdata也ateoleconfrontisrowinraidl.U打demeaththisrichdataresources也ereexistsppggpy,o-imrtantotentialandusefulknowlede.Howevertheremabeerrorsintherealworldp,pg,ydata,e.g.,themissingofattributevalues,inapprop
8、riatedataform,duplicateandabnormaldataincometedatanoisdataandinconsistentdata.Thereforehow化ettheefective,pl,y,ginformationfromthesedataisthero
此文档下载收益归作者所有