欢迎来到天天文库
浏览记录
ID:35072216
大小:5.26 MB
页数:63页
时间:2019-03-17
《多源迁移学习算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、m:Sou化ChinaUniversitofTechnoloygy工程硕±学位论文多源巧移学习算法研究1'’私;许.单巧—Vh■托皆苗化乂;打/;:式巧:;库巧-;'纖;-:>|#窮皆巧凉也餐爲巧巧矿這,^游;齡雄班^入女'''.'巧巧法戈'.M货當说巧乱.r;..,:繼變露纖講受辭早V:作者姓名严海锐工程领域软件工程校内指导教师罗荣华副教授校外指导教师李慧琪高级工程师所在学院软件学院论文提交日期2016年3月Multi-SourceDomainsTransferLearni
2、ngAlgorithmResearchADissertationSubmittedfortheDegreeofMasterCandidate:YanHairuiSupervisor:A.PLuoRonghuaS.E.LiHuiqiSouthChinaUniversityofTechnologyGuangzhou,China分类号:TP3学校代号:10561学号:201321033412华南理工大学硕士学位论文多源迁移学习算法研究作者姓名:严海锐申请学位级别:工程硕士工程领域名称:软件工程校内指导教师姓名、职称:罗荣华副教授校外指导教师姓名、职称:李慧琪高级工程师论文形
3、式:□产品研发□工程设计应用研究□工程/项目管理□调研报告研究方向:软件工程技术论文提交日期:2016年3月22日论文答辩日期:2016年3月25日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:杨晓伟委员:刘琼郑东曦左保河刘艳霞华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加W标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中yA明确方式标明。本人完全意识到本声明的法律后果由本人
4、承担。'谷作者签名:f7矣以曰期;W年^月曰学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:研究生在校攻读学位期间论文王作的知识产权单位属华南理王大学。学校有权保存并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅(除在保密期内的保密论文外);学校可W公布学位论文的全部或部分内容,可W允许采用影印、缩印或其它复制手段保存、汇编学位一论文。。本人电子文档的内容和纸质论文的内容相致本学位论文属于;□保密。,在年解密后适用本授权书沁M呆密,同意在校园网上发布,供校内师生和与学校
5、有共享协议的单位浏览;同意将本人学位论文提交中国学术期刊(光盘版)电子杂志社全文出版和编入CNKI《中国知识资源总库》,传播学位论文的全部或部分内容。请在"古CW上相应方框内打)7务峡作者签名:气日期崎、^占以(:;指导教师签名曰期句译丰累缉摘要传统机器学习训练数据集和测试数据集必须满足来自同一分布的假设前提。如果测试数据集数据分布发生改变,那么就需要重新训练预测分类器以适应这种变化。而迁移学习的方法最大特点在于利用相关领域的知识来帮助完成目标领域中的学习任务。它能够有效地在相似的领域或任务之间进行信息的共享和迁移,使传统的从零开始的学习变
6、成可积累的学习,具有成本低、效率高等优点。迁移学习作为机器学习的一种,在计算机视觉、图像分类、文档分类和情感分析等领域都有着广泛的应用。迁移学习方法的分类效果很大程度依赖于源领域与目标领域的分布关系,由于每一个源领域分布都不一样,因此有多源迁移学习研究的产生。而多源迁移学习在多个源领域中选择出合适的源域数据进行知识迁移,从而以减少负迁移的发生。本文针对多源迁移学习算法进行研究,所做工作如下:1、提出一种基于伪标注核均值匹配的多源迁移学习。伪标注核均值匹配思想的引入可以更为有效地给每一个源领域样本赋予一个合理的权值,然后再利用拉普拉斯图将每一个源领域根据与目标领域的相似
7、度赋予一个域的权值,两个权值结合起来使得训练样本实例更为合理,从而提升分类的效果。最后通过实验验证算法具有更好的分类性能。2、提出一种基于伪标注核均值匹配的多源迁移学习的迭代模型。进一步研究,在伪标注核均值匹配的多源迁移学习的基础上加入迭代的思想,将上一次的迭代出来的标签结果作为下一次迭代的分类标签的前提条件,进而逐步提升准确度,并分析解决迭代的终止条件。3、本文在改变每一个源领域权重时,引入结合KMM和SVM为一个整体框架使用的方法。此方法可以调节约束领域的分类的最优平面和最小化域适应间隔两种因素的重要程度,从而在更新每一个源领域权重时可以同时考虑
此文档下载收益归作者所有