基于聚类动态TrAda Boost迁移学习分类方法

基于聚类动态TrAda Boost迁移学习分类方法

ID:35157275

大小:1.23 MB

页数:65页

时间:2019-03-20

基于聚类动态TrAda Boost迁移学习分类方法_第1页
基于聚类动态TrAda Boost迁移学习分类方法_第2页
基于聚类动态TrAda Boost迁移学习分类方法_第3页
基于聚类动态TrAda Boost迁移学习分类方法_第4页
基于聚类动态TrAda Boost迁移学习分类方法_第5页
资源描述:

《基于聚类动态TrAda Boost迁移学习分类方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广东工业大学硕士学位论文(工学硕士)基于聚类动态TrAdaBoost迁移学习分类方法李子彬二○一八年五月分类号:学校代号:11845UDC:密级:学号:2111504108广东工业大学硕士学位论文(工学硕士)基于聚类动态TrAdaBoost迁移学习分类方法李子彬指导教师姓名、职称:刘波教授学科(专业)或领域名称:控制科学与工程学生所属学院:自动化学院论文答辩日期:2018年05月30日ADissertationSubmittedtoGuangdongUniversityofTechnologyfortheDegreeofMaster(MasterofEngineeringScience)

2、ClassificationMethodBasedonClusteringDynamicTrAdaBoostTransferLearningCandidate:ZibinLiSupervisor:Prof.BoLiuMay2018SchoolofAutomationGuangdongUniversityofTechnologyGuangzhou,Guangdong,P.R.China,510006摘要摘要随着科技的进步和人工智能的发展,科学工作者们越来越重视从海量的数据中提取和分类数据。但是我们在工作的过程中发现,数据集中无标签的数据的数量非常多而有标签的数据非常少。并且在数据的提取分类

3、的过程中,人工标记数据方式非常的耗时,这就限制采用人工标记数据的行为方式,也限制了在实验中带标签数据样本的数量。针对这种情况,迁移学习正好解决数据集缺失的问题。迁移学习可以利用相关领域的大量的未标记过的数据来帮助目标领域中少量的标记数据的学习,在经过最近十几年的发展,各种基于迁移学习的算法被提出,目前已经广泛的应用于机器学习,数据挖掘等其他领域。传统的AdaBoost算法是对特征的权重进行迭代,对于分类正确的,赋予较低的权重值,对于错误分类的,赋予较高的权重值。近年来,人们在AdaBoost算法的基础上提出了基于TrAdaBoost迁移学习算法来解决训练集数据过少的问题。然而在实验的过程

4、中发现,TrAdaBoost算法在迁移的过程中源域的权值会出现两极分化等问题,影响着权重迭代的进行。本文提出了一种基于聚类动态TrAdaBoost迁移学习算法来研究分类的问题,主要的研究内容如下:(1)针对迁移学习过程中的问题,详细的介绍了基于聚类动态TrAdaBoost迁移学习算法,包括其基本思想,训练过程,算法具体的流程以及实验的过程。(2)针对TrAdaBoost算法出现的权值问题,提出通过在迁移学习过程中加入动态因子的方法,在源域的权重更新过程中,根据在目标域中的误差,添加一个动态参数来动态的调整。(3)在迁移学习实施的过程中,源域能够帮助目标域的学习,但是在源域中存在着大量的极

5、不相似的数据,在迁移的过程中,这会极大的干扰分类的精度。考虑到这情况,我们提出通过聚类算法来对源域的数据进行清洗,从而达到提高我们分类的精度的目的。在本文中,我们介绍了聚类动态TrAdaBoost迁移学习算法,我们通过在20Newsgroups数据集上进行实验,来证明本文提出的算法的有效性和可靠性。然后将I广东工业大学硕士学位论文其与传统的AdaBoost算法和TrAdaBoost算法在数据集中进行比较,证明本算法精确度更高和更具有优越性。关键词:迁移学习;动态;聚类;AdaBoost;TrAdaBoostIIABSTRACTABSTRACTNowadays,withtheadvance

6、mentofscienceandartificialintelligence,scientistsarepayingmoreandmoreattentiontoextractingandclassifyingthedatafromtheamountsofdata.However,wefoundthattherearealotofunlabeleddatawhilelittlelabeleddata.Andintheprocessofextractingandclassifyingdata,markingdatabypersonisverytimeconsuming,whichlimits

7、thebehaviorofmanuallymarkingdataandthenumberoflabeleddatasamplesintheexperiment.Basedonthissituation,transferlearningcansolvetheseshortcomings.Transferlearningcanusealargeamountofunmarkeddatainrelatedfieldstohelpasmall

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。