欢迎来到天天文库
浏览记录
ID:37393459
大小:12.52 MB
页数:102页
时间:2019-05-23
《距离度量学习方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、研究生毕业论文论文题目:作者:专业:研究方向:(申请博士学位)距离度量学习方法的研究詹德川计算机应用技术人工智能指导教师:周志华教授二O—O年四月2ResearchonDistanceMetricLearningApproachesbyDe.ChuanZhanSupervisedbyProf.Zhi.HuaZhouAdissertationsubmittedtotheGraduateSchoolofNanjingUniversityfortheDegreeofDOCTORofPHILOSOPHYDepartmentofComputerSc
2、ience&TechnologyNanjingUniversityNanjing,April,2010◎CopyrightbyDe—ChuanZhan,2010Allrightsreserved34博士学位论文:摘要摘要机器学习是研究计算机系统如何根据以往经验来改善自身性能的学科,是目前计算机科学中最活跃的学科分支之一。很多机器学习方法的性能都与距离度量密切相关,因此近年来距离度量学习逐渐成为一个热门研究领域。本文对距离度量学习进行了系统地研究,主要取得了以下的创新成果:(1)提出一种样本自适应的距离度量学习方法:已有的距离度量学习方法通
3、常以寻找一个统一的距离度量方法为目标,然而在一些实际应用中样本之间的距离度量可能随着受关注样本的变化而变化。本文通过设计度量传播策略,提出了一种样本自适应的距离度量学习方法lso。该方法能够自适应地为不同样本产生不同的距离度量。实验结果表明,与现有的距离度量学习技术相比,ISD取得了更好的效果。(2)提出一种特征稀疏化距离度量学习方法:常见的距离度量学习技术基于所有的原始特征产生距离度量,难以了解原始特征各自的重要性。本文提出了一种特征稀疏化的距离度量学习方法DFUE。通过引入三-2,J正则化并且使得距离度量值只和少部分原始特征相关,DF
4、iJE学习产生的距离度量具有一定的可理解性。实验结果表明,和现有的距离度量学习方法相比,DFUE分类性能相当,但可理解性更好。(3)提出一种半监督距离度量学习方法:常见的距离度量学习方法需要大量的标记样本才能进行有效的学习,而在很多实际应用中只有少量标记样本。本文提出了一种半监督距离度量学习方法CDML。CDML首先使用简单分类器对未标记样本进行标记预测,然后利用分类器提供的“伪标记”样本进行距离度量学习。理论分析表明CDML方法可以提高距离度量学习的效果,实验验证了CDML方法的有效性。f41提出一种基于双视图关联距离度量的半监督学习方
5、法:当数据包含两个充分冗余视图时,只考虑在单一视图上构建距离度量将造成信息的浪费。本文提出了一种基于双视图关联距离度量的半监督学习方法OLTV。该方法先利用核典型相关分析产生双视图关联距离度量,在此基础上进行半监督学习。实验表明,OLTV通过考虑双视图关联,即使只有一个标记样本,世:I可以进行有效的半监督学习,且分类性能优于其他对比方法。(5)提出一种基于类别偏置距离度量的流形学习方法:流形学习技术试图找到高维数据的本真低维嵌入,本真低维空问反映了数据的内在真实分布,但真实分布未必是有利于分类。本文提出了一种基j二类别偏置距离度量的流形学
6、习方法S-lsomap。通过使用样本类别信息扭曲低维流形的结构,在降维的同时扩大气博士学位论文:摘要不同类别之间的距离。实验结果表明,和其他流形学习方法相比,S-Isomap能取得更好的分类性能。关键词:机器学习,数据挖掘,距离度量学习,半监督学习,降维,流形学习6垒!墨翌!!一一一一一.一一.——●___-—___-^_______-___—__————————————●——^__—————————————-—_l_____________-___-____——_-——————————一AbstractMachineleamingisa
7、scientificdisciplineconcernedwiththeresearchwhichallowscomputersystemstoimprovetheirperformancewithempiricalexperiences.Ithasbecomeoneofthemostactivefieldsofcomputersciencenow.Manymachinelearningalgorithmsheavilyrelyonthedjstancemetric.Thusdistancemetricleaminghasbecomeon
8、eoftheimportantfieldsinmachineleamingresearchrecently.Thisdissertationfocusesondistancemetriclea
此文档下载收益归作者所有