基于稀疏图的流形正则化多核半督分类研究

基于稀疏图的流形正则化多核半督分类研究

ID:37089606

大小:2.14 MB

页数:69页

时间:2019-05-17

基于稀疏图的流形正则化多核半督分类研究_第1页
基于稀疏图的流形正则化多核半督分类研究_第2页
基于稀疏图的流形正则化多核半督分类研究_第3页
基于稀疏图的流形正则化多核半督分类研究_第4页
基于稀疏图的流形正则化多核半督分类研究_第5页
资源描述:

《基于稀疏图的流形正则化多核半督分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391学校代码:10697密级:公开学号:201531491专业学位硕士论文SPECIALIZEDMASTER’SDISSERTATION基于稀疏图的流形正则化多核半监督分类研究学科名称:软件工程作者:王娜指导老师:王小凤副教授西北大学学位评定委员会二○一八年ResearchonMulti-KernelSemi-supervisedClassificationofManifoldRegularizationBasedonSparseGraphsAthesissubmittedtoNorthwestUniversityinpartialfulfillmentoftherequ

2、irementsforthedegreeofMasterinSoftwareEngineeringByWANGNaSupervisor:WANGXiaofengAssociateProfessorJune2018摘要在信息时代迅猛发展的大环境前提下,数据量也随之增长到海量级别,例如图像分类、病理检测、网页推荐等领域,其中标记数据特别稀少,无标记数据大量存在。基于该现实状况,迫切需要对半监督学习算法进行研究,发掘无标记数据中隐含着的信息,加以合理利用,并创造出价值。在半监督学习算法中,基于图的半监督分类算法更是凭借其较好的解释性和分类性能,受到诸多学者的青睐,得到不断研究和使用。如何提高

3、分类的精度以及分类的效率成为研究重点,本论文以此为主线展开工作,主要研究成果如下:1.提出一种结合模糊C-均值和图转导的稀疏图半监督分类算法。基于部分无标记数据对分类产生的促进作用,本文通过模糊C-均值算法将未标记样本数据进行预选取,挑选出携带对分类有帮助的未标记数据,然后构建近邻稀疏图,使得构图的数据节点大大减少,提高构图的效率;利用图转导的方式将预选取的未标记样本进行分类,得到类别标记,获得更多可靠的标记样本数据;最后利用流形正则化框架训练所有的样本数据,实现数据分类。实验结果表明:相比于同类二分类算法而言,该分类算法分类精度高,分类准确度达到了95%及以上。2.提出对秦俑碎片图像

4、的多特征融合,综合纹理、形状等特征进行图像的描述,避免单特征对于数据信息描述不全面而造成分类准确度低的问题。3.提出一种流形正则化多核模型的半监督分类算法。该算法针对单一特征表征数据能力低的局限,引入多核函数,将多种特征进行融合;同时依据多核学习的高数据映射能力和灵活的特征组合能力,为半监督的多分类算法提供数据依据,提高分类器的泛化能力。实验结果表明:加入多核函数融合多种特征,来描述样本数据的分类效果远比单特征描述样本数据的分类效果优。4.设计并实现了基于半监督的秦俑碎片分类系统。将半监督分类算法应用于兵马俑文物碎片分类中,实现了秦俑碎片的部位分类,为兵马俑的后期拼接及整俑修复作铺垫。

5、关键词:半监督,模糊C-均值,流形正则化,多核函数,多特征融合IABSTRACTInthecontextoftherapiddevelopmentoftheinformationage,theamountofdatahasincreasedtothemasslevel.Butinsomeareas,suchasimageclassification,pathologicaldetection,webrecommendationsandotherfields,wheretaggeddataareparticularlyscarceandunmarkeddataexistsinlargen

6、umbers.Basedonthisreality,itisanurgentneedtostudysemi-supervisedlearningalgorithmstouncoverthehiddeninformationinunlabeleddata,andmakeuseofthemtocreatevalue.Inthesemi-supervisedlearningalgorithm,thegraph-basedsemi-supervisedclassificationalgorithmismorefavoredbymanyscholarsbecauseofitsbetterinte

7、rpretabilityandclassificationperformance.Soithasbeencontinuouslystudiedandused.Themainresearchresultsareasfollows:First,asemi-supervisedclassificationalgorithmbasedonsparsegraphcombinedwithfuzzyc-meansandgraphtransductionisp

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。