欢迎来到天天文库
浏览记录
ID:13668457
大小:605.00 KB
页数:23页
时间:2018-07-23
《基于半监督学习方法的研究大学毕业论文.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、河北大学2009届本科生毕业论文(设计)基于半监督学习方法的研究摘要近几年来随着机器学习在数据分析和数据挖掘中的广泛应用,半监督学习的理论研究成果已经部分应用于实际问题的解决。半监督学习(Semi-supervisedLearning)是模式识别和机器学习中的重要研究领域,一直为国际机器学习界所广泛关注。本文主要研究了半监督学习方法,具体考虑了不同度量对半监督学习的影响。考虑关于标记的和未标记数据的一般问题的学习,其通常被称为半监督学习或转导推理。半监督学习的原则性方法是定义一个有关标记的和未标记的点集的固有结构所共同显现的足够平稳的
2、分类函数。实验结果表明,使用指数度量的GCM算法的性能最优,而使用欧几里得度量的GCM算法的性能最差;另外,不同度量中的参数取值对算法的性能具有一定的影响。关键词:半监督机器学习GCMCM18河北大学2009届本科生毕业论文(设计)ABSTRCATWithMachinelearningmethodsbeingwidelyappliedforrealworlddataanalysisanddatamining,semi-supervisedlearninghasbeenintroduceforsolvingmoreandmorereal
3、worldproblems.Semi-supervisedlearning,whichcombinesinformationfrombothlabeledandunlabeleddataforlearningtasks,hasdrawnwideattention.Weconsiderthegeneralproblemoflearningfromlabeledandunlabeleddata,whichisoftencalledsemi-supervisedlearningortransductiveinference.Aprincip
4、ledapproachtosemi-supervisedlearningistodesignaclassifyingfunctionwhichissuf_cientlysmoothwithrespecttotheintrinsicstructurecollectivelyrevealedbyknownlabeledandunlabeledpoints.ExperimentalresultsshowthatperformanceofGCMalgorithmforusingtheexponentialmeasureissuperiorto
5、othermeasuresandperformanceofGCMalgorithmforusingtheEuclideanmeasureisinferiortoothermeasures.Moreover,argumentsfordifferentmeasuresimpactontheperformanceofalgorithm.Keywords:Semi-supervisedMachinelearingGCMCM18河北大学2009届本科生毕业论文(设计)目录一引言11.1研究背景和意义11.1.1研究背景11.1.2研究意义11.
6、2国内外研究现状11.3研究内容21.4论文组织与安排2二半监督学习算法32.1朴素贝叶斯分类器32.1.1贝叶斯法则32.2.2朴素贝叶斯分类器学习32.2k-近邻算法4三常用的度量方法63.1加权s阶Minkowski度量63.2非线性度量63.3K近邻度量63.4指数度量63.5双曲正切度量7四基于核策略的半监督学习算法84.1CM算法818河北大学2009届本科生毕业论文(设计)4.2GCM算法8五总体设计与详细设计105.1总体设计105.2详细设计10六实验研究与分析136.1实验数据136.1.1CM算法实验数据136.
7、1.2GCM算法实验数据146.2实验方法146.2.1CM实验方法146.2.2GCM实验方法146.3实验结果与分析15七结论17谢辞18参考文献1918河北大学2009届本科生毕业论文(设计)一引言1.1研究背景和意义1.1.1研究背景当前社会已进入高速发展的信息化时代,每天面对的数据大量而繁琐,数据分类的工作越来越重要。在传统的监督学习中,学习器通过对大量有标记的训练例进行学习,从而建立模型用于预测未见示例的标记。目前,利用未标记示例的主流学习技术主要有半监督学习和主动学习,但是它们的基本思想却有显著不同。在半监督学习中,学习
8、器自行利用未标记示例,学习过程无人工干预。主动学习假设学习器对环境有一定的控制能力,可以主动向学习器之外的神谕(可以是人,也可以是能够为示例提供真是标记的其它过程)进行查询来获得训练例的标记。对比半监督学习和主动学习可以
此文档下载收益归作者所有