基于半监督学习方法的研究本科学位论文.doc

基于半监督学习方法的研究本科学位论文.doc

ID:11063774

大小:605.00 KB

页数:23页

时间:2018-07-09

基于半监督学习方法的研究本科学位论文.doc_第1页
基于半监督学习方法的研究本科学位论文.doc_第2页
基于半监督学习方法的研究本科学位论文.doc_第3页
基于半监督学习方法的研究本科学位论文.doc_第4页
基于半监督学习方法的研究本科学位论文.doc_第5页
资源描述:

《基于半监督学习方法的研究本科学位论文.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、河北大学2009届本科生毕业论文(设计)基于半监督学习方法的研究摘要近几年来随着机器学习在数据分析和数据挖掘中的广泛应用,半监督学习的理论研究成果已经部分应用于实际问题的解决。半监督学习(Semi-supervisedLearning)是模式识别和机器学习中的重要研究领域,一直为国际机器学习界所广泛关注。本文主要研究了半监督学习方法,具体考虑了不同度量对半监督学习的影响。考虑关于标记的和未标记数据的一般问题的学习,其通常被称为半监督学习或转导推理。半监督学习的原则性方法是定义一个有关标记的和未标

2、记的点集的固有结构所共同显现的足够平稳的分类函数。实验结果表明,使用指数度量的GCM算法的性能最优,而使用欧几里得度量的GCM算法的性能最差;另外,不同度量中的参数取值对算法的性能具有一定的影响。关键词:半监督机器学习GCMCM18河北大学2009届本科生毕业论文(设计)ABSTRCATWithMachinelearningmethodsbeingwidelyappliedforrealworlddataanalysisanddatamining,semi-supervisedlearningh

3、asbeenintroduceforsolvingmoreandmorerealworldproblems.Semi-supervisedlearning,whichcombinesinformationfrombothlabeledandunlabeleddataforlearningtasks,hasdrawnwideattention.Weconsiderthegeneralproblemoflearningfromlabeledandunlabeleddata,whichisoftenc

4、alledsemi-supervisedlearningortransductiveinference.Aprincipledapproachtosemi-supervisedlearningistodesignaclassifyingfunctionwhichissuf_cientlysmoothwithrespecttotheintrinsicstructurecollectivelyrevealedbyknownlabeledandunlabeledpoints.Experimentalr

5、esultsshowthatperformanceofGCMalgorithmforusingtheexponentialmeasureissuperiortoothermeasuresandperformanceofGCMalgorithmforusingtheEuclideanmeasureisinferiortoothermeasures.Moreover,argumentsfordifferentmeasuresimpactontheperformanceofalgorithm.Keyw

6、ords:Semi-supervisedMachinelearingGCMCM18河北大学2009届本科生毕业论文(设计)目录一引言11.1研究背景和意义11.1.1研究背景11.1.2研究意义11.2国内外研究现状11.3研究内容21.4论文组织与安排2二半监督学习算法32.1朴素贝叶斯分类器32.1.1贝叶斯法则32.2.2朴素贝叶斯分类器学习32.2k-近邻算法4三常用的度量方法63.1加权s阶Minkowski度量63.2非线性度量63.3K近邻度量63.4指数度量63.5双曲正切度量7

7、四基于核策略的半监督学习算法84.1CM算法818河北大学2009届本科生毕业论文(设计)4.2GCM算法8五总体设计与详细设计105.1总体设计105.2详细设计10六实验研究与分析136.1实验数据136.1.1CM算法实验数据136.1.2GCM算法实验数据146.2实验方法146.2.1CM实验方法146.2.2GCM实验方法146.3实验结果与分析15七结论17谢辞18参考文献1918河北大学2009届本科生毕业论文(设计)一引言1.1研究背景和意义1.1.1研究背景当前社会已进入高速

8、发展的信息化时代,每天面对的数据大量而繁琐,数据分类的工作越来越重要。在传统的监督学习中,学习器通过对大量有标记的训练例进行学习,从而建立模型用于预测未见示例的标记。目前,利用未标记示例的主流学习技术主要有半监督学习和主动学习,但是它们的基本思想却有显著不同。在半监督学习中,学习器自行利用未标记示例,学习过程无人工干预。主动学习假设学习器对环境有一定的控制能力,可以主动向学习器之外的神谕(可以是人,也可以是能够为示例提供真是标记的其它过程)进行查询来获得训练例的标记。对比半监督学习和主动学习可以

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。