欢迎来到天天文库
浏览记录
ID:37045629
大小:647.08 KB
页数:51页
时间:2019-05-15
《基于半监督判别分析的迁移学习算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、工程硕士学位论文基于半监督判别分析的迁移学习算法研究冯其帅哈尔滨理工大学2018年3月国内图书分类号:TP181工程硕士学位论文基于半监督判别分析的迁移学习算法研究硕士研究生:冯其帅导师:王莉莉申请学位级别:工程硕士学科、专业:计算机技术所在单位:计算机科学与技术学院答辩日期:2018年3月授予学位单位:哈尔滨理工大学ClassifiedIndex:TP181DissertationfortheMasterDegreeinEngineeringResearchofTransferLearningAlgorithmBasedonSemi-supervisedDi
2、scriminantAnalysisCandidate:FengQishuaiSupervisor:WangLiliAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerTechnologyDateofOralExamination:March,2018University:HarbinUniversityofScienceandTechnology哈尔滨理工大学硕士学位论文原创性声明本人郑重声明:此处所提交的硕士学位论文《基于半监督判别分析的迁移学习算法研究》,是本人在导师指导下,在哈尔滨
3、理工大学攻读硕士学位期间独立进行研究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写过的研究成果。对本文研究工作做出贡献的个人和集体,均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。作者签名:日期:年月日哈尔滨理工大学硕士学位论文使用授权书《基于半监督判别分析的迁移学习算法研究》系本人在哈尔滨理工大学攻读硕士学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归哈尔滨理工大学所有,本论文的研究内容不得以其他单位的名义发表。本人完全了解哈尔滨理工大学关于保存、使用学位论文的规定,同意学校保留并向有关部门提交论文和电子版本,
4、允许论文被查阅和借阅。本人授权哈尔滨理工大学可以采用影印、缩印或其他复制手段保存论文,可以公布论文的全部或部分内容。本学位论文属于保密,在年解密后适用授权书。不保密√。(请在以上相应方框内打√)作者签名:日期:年月日导师签名:日期:年月日基于半监督判别分析的迁移学习算法研究摘要传统机器学习的本质是高级的统计应用,要求训练数据和测试数据具有相同的概率分布。这个前提限制了机器学习的发展,直到迁移学习的提出。迁移学习的思想是把已学习到的知识应用到相关领域来帮助目标任务的完成,并且不要求数据同分布。随着人类社会迈入人工智能时代,更接近人类自身学习的迁移学习能够更有效地
5、处理现实中的庞杂数据,具有重大的研究价值。本文主要对迁移学习方法进行研究,以判别分析为理论基础,根据目前研究成果,提出两种不同的迁移学习算法。首先,传统实例迁移学习方法估计分布参数比较困难,泛化效果较差,针对该问题提出一种基于正则化判别分析的迁移学习算法。在线性判别分析的基础上引入高斯核及正则项,改进为半监督的高斯核判别分析,在不考虑类条件概率密度分布的同时,更适用于处理现实数据。基于该方法构建判别空间,对源域中可重用数据进行迭代筛选,有效避免对分布参数的估计。另外为了避免过拟合现象的发生,一方面构造伪标记数据以辅助筛选,使标记数据的类别信息和未标记数据的分布
6、信息得以充分利用。另一方面,在筛选过程中定义距离度量和指示矩阵,可有效选出距离目标域数据最近的源域数据。为验证该算法的有效性,使用20Newsgroups等数据集进行实验,结果表明迁移的正确率和学习模型的泛化能力得到有效提高。其次,大多数特征迁移学习方法只注重域间共有特征,忽略各域独有特征,针对该问题提出一种基于稀疏局部判别分析的迁移学习算法。在线性判别分析的基础上,结合稀疏的局部保持投影,改进为新的半监督特征提取方法,充分利用样本数据的局部结构信息和全局监督信息。使用该方法建立源域和目标域的子空间,在保持各域特有特征的同时,有效提取域间最优的共享特征。为了避
7、免过高的运算复杂度,采用对齐子空间的方式来减小域间的差异,从而实现知识的迁移。为证明该算法的有效性,使用COIL20等数据集进行实验,结果显示出更好的迁移性能。关键词迁移学习;判别分析;半监督学习;稀疏图-I-ResearchofTransferLearningAlgorithmBasedonSemi-supervisedDiscriminantAnalysisAbstractTheessenceoftraditionalmachinelearningisadvancedstatisticalapplications,providedthatthetraini
8、ngdataandtestdatare
此文档下载收益归作者所有