欢迎来到天天文库
浏览记录
ID:37014823
大小:312.00 KB
页数:15页
时间:2019-05-11
《基于半监督的SVM迁移学习的算法研究开题》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、论文题目:基于SVM的半监督迁移学习的算法研究姓 名:***年 级:专 业:指导教师:硕士研究生开题报告开题内容1算法的提出及研究意义2国内外同类技术研究现状3研究内容与研究方法4技术路线5算法简易描述硕士研究生开题报告我们生活在大量数据日积月累的年代。每天,来自网络、商业、社会、科学和工程、医学以及我们日常生活的方方面面的数兆兆字节或数千兆兆字节的数据注入我们的计算机网络、万维网和各种数据存储设备。世界范围的商业活动产生了巨大的数据集,包括销售事务、股票交易记录、产品描述、促销、公司利润和业绩以及顾客反馈。科学和工
2、程实践持续不断地从遥感、过程测量、科学实验、系统实施、工程观测和环境监测中产生多达数千兆兆字节的数据。数据的爆炸式增长、广泛可用和巨大数量使得我们的时代成为真正的数据时代。而将数据转换成有价值的信息的其中一个重要的步骤是分类。分类可以从内容丰富、蕴含大量信息的数据库中提取描述重要信息的数据类,从而作出智能的商务决策,其应用非常广泛。然而针对不同类型的数据,分类的方法却有很多,如贝叶斯分类,支持向量机(SVM)分类,C4.5等。SVM是机器学习中的重要算法,近年来也得到了广阔的发展,特别是在生物信息、文本分类等领域中。而基本
3、的SVM算法是有监督的的学习算法,它是基于统计学习理论的原理性方法。其主要思想是:建立一个最优决策超平面,使得该平面两侧距平面最近的两类样本之间的距离最大化。从而1算法的提出及研究意义硕士研究生开题报告1.1算法的提出对分类问题提供良好的泛化能力,所采用的数据往往都需要满足一定条件。然而在传统的SVM分类方法中,大部分都是有监督的,即用带标签的数据来训练分类模型,并且只局限于目标数据域。然而,收集带标签的实例是非常困难且要耗费巨大的,不带标签的数据却是相当巨大,很容易获取。如果只有少量的带标签的数据和大量未标记的数据可用,
4、那么半监督学习在一定程度上便能弥补因训练数据不足而导致过拟化的分类误区。很多机器学习的方法,无论是传统的机器学习还是半监督学习问题,都是建立在一个共同假设:测试数据与训练数据属于统一数据分布与同一特征空间。一旦数据分布有差异,很多学习方法便无法表现的很好。重新标记大量数据,这样的代价是昂贵的。基于这个局限,我们便引入了迁移学习,目的是从其他相关辅助数据域中迁移知识去帮助目标域中解决学习任务。因此,迁移学习的出现使的这些问题可以迎刃而解。迁移学习(TransferLearning)的目标是将从一个环境中学习的知识用来帮助新环
5、境中的学习任务。如QiangYang等人迁移学习对于文本挖掘的应用。迁移学习不但解决了训练数据匮乏的问题,而且在某种程度上可能充分的利用了数据的价值。于是我们提出了基于SVM的半监督迁移学习的算法。硕士研究生开题报告首先,相对于传统SVM算法,基于SVM的半监督迁移学习算法很好的利用相关领域数据大量带标签的数据来帮助我们目标领域数据的分类万挖掘,在某种程度上既提高了SVM分类器的准确率,又节约了大量的人力物力去标记样本来满足分类器训练的要求。在Web领域方面,还能充分利用过时的数据来帮助新形成的领域进行分析。避免了数据的浪
6、费。其次,结合半监督学习与迁移学习的算法是现今比较缺乏的研究方向,迁移学习方法理论上可以使得很多传统的分类器的准确率得到进一步的提升,因而迁移学习的研究可以扩展到其他比较经典的数据挖掘算法中,来提高数据分析的准确率。硕士研究生开题报告1.2研究意义2国内外研究现状及分析硕士研究生开题报告近几年来,基于SVM分类算法的扩展越来越受到研究者的关注,随着相关研究的不断深入,与其他学习方法结合的SVM算法应运而生。目前,人们在基于SVM算法与各种学习技术相结合,提出了不同类型的基于SVM分类方法,以解决不同的实际问题。其方法也陆续
7、被提了出来,像自训练半监督SVM算法、局部化SVM优化方法以及跨域SVM算法方法等。目前迁移学习技术的发展势头强劲,不乏大量迁移学习分类的算法,如TrAdaboost、CDSVM已证实了这一点。究其原因主要是迁移学习在现实中有着广泛的应用前景,如文本分类、Web挖掘、社交网络分析、生物信息学等。SVM算法的难点在于优化SVM分类器目标函数找到支持向量来构建最优超平面。V.Vapnik提出了基本的SVM分类网络,利用带标签数据进行有监督的训练分类器,最终得到最优分类超平面。由于训练数据与测试数据的分布不一致,训练得到的分类器
8、可能效果不怎么好。硕士研究生开题报告传统的SVM是有监督的学习方法。由于半监督学习方法的流行,于是半监督SVM的研究也被提出。如C.G.YuanqingLi、HuiqiLi和ZhengyangChin提出了半监督SVM算法,便很好的利用了测试集的未标记数据与带标签的训练数据结合一起训练分类器,不仅在一定
此文档下载收益归作者所有