基于聚类分析的标签传播半监督学习的研究

基于聚类分析的标签传播半监督学习的研究

ID:33018494

大小:81.71 KB

页数:43页

时间:2019-02-19

基于聚类分析的标签传播半监督学习的研究_第1页
基于聚类分析的标签传播半监督学习的研究_第2页
基于聚类分析的标签传播半监督学习的研究_第3页
基于聚类分析的标签传播半监督学习的研究_第4页
基于聚类分析的标签传播半监督学习的研究_第5页
资源描述:

《基于聚类分析的标签传播半监督学习的研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、代号10701学号0922121538分类密级公开TP301.6题(中、英文)目基于聚类分析的标签传播半监督学习研究ResearchonLabelPropagationofSemi-supervisedBasedonClustering韩玉想杨利英副教授作者姓名指导教师姓名、职称计算机应用技术工学学科门类学科、专业提交论文日期二?一二年五月西安电子科技大学学位论文创新性声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文

2、中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。木人签名:日期西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业离校后,发表论文或

3、使用论文工作成果时署名单位仍然为西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许釆用影印、缩印或其它复制手段保存论文。(保密的论文在解密后遵守此规定)本学位论文属于保密,在—年解密后适用本授权书。本人签名:日期导师签名:日期摘要]摘要半监督学习是机器学习的一个重要分支,在近些年互联网爆炸式发展过程中,岀现了大量的数据分类需求,半监督学习可以利用有限的已标记数据和大量的未标记数据来解决数据分类的问题,有效缓解了目前获得大量未标记数据容易

4、而获得大量已标记数据困难的窘困,因此受到了国际机器学习领域的高度关注。作为半监督学习一种主流方法,基于图的半监督学习成为新的研究热点O本文着重研究基于图的半监督中的标签传播算法,分析并优化了标签传播算法。为了使聚集成簇的数据间标签传播较快,并避免把处于决策边界附近的同类已标记样本分割到不同的类中,我们提出了基于聚类分析的图构造预处理方法,通过增加属于同一聚类数据点之间边的权重,提高分布密集数据之间的关联,减小它们在标签传播中被划分为不同类的概率。同时,针对标签传播扩散速度较慢和距离已标记数据较远

5、处数据点分类模糊性较大的问题,提出基于自训练框架的学习方式,在标签传播过程中把未标记数据中置信度较高的那部分数据加入到已标记数据集中,增加标签传播的数据源,提高分类准确率。本文在UCI数据集上进行了实验研究,实验验证了所提算法的有效性和优越性。实验结果表明,基于聚类分析的标签传播在一般情况下优于经典标签传播方法,当已标记数据接近分类边界时优越性尤为明显。自训练标签传播方法与经典标签传播方法比较,速度和准确率都有提高。关键词:半监督学习标签传播聚类自训练Abstract3AbstractScmi-

6、supcrviscdlearningisanimportantbranchofmachinclearning,withtheexplosionofinternetinrecentyears,thereisagreatamountofdataanalysisdemandSemi-supervisedlearningcanutilizelimitedlabeleddataandalargenumberofunlabeleddatatosolvedataclassificationproblem・Th

7、ereforeresearchersofmachinelearningpayintenseattentiontothisfieldofresearch・Asapopularmethodofsemi-supervisedlearning,graph-basedsemi-supervisedlearninghasbeenanewhotspotofresearchInthispaper,weconcentrateongraph-basedsemi-supervised1earning,analyzin

8、gandoptimizinglabelpropagationalgorithm・Inordertosolvetheaccuracydeclineproblemcausedbythelabeleddataclosetoclassificationbound,weproposedclusteringbasedgraphconstructionmethod・Weaddtheweightofedgesonbothsideofwhichthedatapointbelongtothesameclusterc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。