欢迎来到天天文库
浏览记录
ID:33393014
大小:2.92 MB
页数:84页
时间:2019-02-25
《半监督学习若干问题的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要中文摘要在现实应用中,由于资源、人力与不可克服的条件限制,标签数据的获取存在一定的困难。在少量标签数据和大量未标签数据的情况下,如何有效地提高传统监督学习模型的泛化能力和无监督学习的高效性成为半监督学习的主要问题。半监督、学习的研究和探索具有深远的实际意义,一方面利用大量无标签数据辅助少量标签数据构建精良的学习模型,另一方面在少量标签数据(先验知识)的指导下,无监督学习过程更加合理高效。本文探讨了半监督学习技术在复杂数据聚类、分类和移动对象异常轨迹探测三个方面问题的应用研究,并在分析已有经典
2、算法不足的基础上设计和实现相应的算法:(1)面向结构复杂数据的半监督聚类算法SCDCS,有效地发现任意形状和多密度分布的簇,并具有一定的抗噪声能力。(2)基于监督聚类的半监督分类算法N2SC,减少噪声数据对协同训练算法性能的影响,提高分类器的性能。(3)基于半监督技术的异常轨迹探测算法Semi.TOD,结合少量异常轨迹先验知识的指导和不同角度的异常检测思路,减少算法受应用背景和人为因素的影响,自动地探测更有意义的异常轨迹。不同的公共数据集和现实应用数据对这些算法的测试表明本文在半监督学习技术方面
3、研究的有效性,充实了半监督学习的研究工作,具有一定的应用基础。关键词:半监督学习,结构复杂数据,监督聚类,分类,异常轨迹夕‰j◇、^。~鼻IAbstractDuetolimitedresources,obtainingvastlabeledexamplesisdifficultforpracticalapplications.晰mafewlabeledexamplesandlargenumberofunlabeledexamples,howtoimprovetheperformanceofsup
4、ervisedandunsupervisedlearningisakeyproblemofsemi—supervisedlearning.Studiesonsemi—supervisedlearningarevaluable.Ontheonehand,semi—supervisedlearningusesvastunlabeledexamplestoassistintrainingamoreeffectiveclassification.Ontheotherhand,theresultsofun
5、supervisedlearningaremoreeffectiveandreasonable研mtheguidanceofpriorknowledges(e⋯glabeledexamplesandpairwiseconstraints).、Wediscussthestudiesonclusteringofcomplicateddataset,classificationandoutlyingtrajectorydetectionintheareaofsemi—supervisedlearnin
6、g.Threenovelalgorithmsareproposedbyanalyzingthedeficiencyoftypicalalgorithms:(1)ThealgorithmofSemi-supervisedClusteringforDatasetwithComplicatedStructure(SCDCS),whichCanfindtheclustersofarbitraryshapes,sizes,anddensities,eveninthepresenceofnoiseandou
7、tliers.(2)ThealgorithmofANovelSemi—supervisedClassificationwithSupervisedClustering(N2SC),whichCanreduceinterferenceofmislabeleddataandenhancetheperformanceofclassifier.(3)ThealgorithmofSemi-supervisedTrajectoryOutlierDetection(Semi—TOD),whichcombine
8、sthepriorknowledgeofafewoutlyingtrajectoriesandmulti-viewoutlierdetectiontodetectavailableoutlyingtrajectoriesaswellasreducesthenegativeimpactofpracticalapplicationsandhumanfactors.Thethreenovelalgorithmsproposedweretestedonsomepublicdatasetsandreald
此文档下载收益归作者所有