基于半监督学习的物体识别

基于半监督学习的物体识别

ID:33975167

大小:1.29 MB

页数:79页

时间:2019-03-02

基于半监督学习的物体识别_第1页
基于半监督学习的物体识别_第2页
基于半监督学习的物体识别_第3页
基于半监督学习的物体识别_第4页
基于半监督学习的物体识别_第5页
资源描述:

《基于半监督学习的物体识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、申请上海交通大学硕士学位论文基于半监督学习的物体识别学校:上海交通大学院系:电子信息与电器工程学院班级:B0703495学号:1070349179学生姓名:褚镇飞工程领域:信号与信息处理指导教师:杨小康上海交通大学电子信息与电器工程学院2010年1月ThesisSubmittedtoShanghaiJiaoTongUniversityfortheM.S.DegreeObjectClassificationBasedonSemi-supervisedLearningClass:B0703495Speciality:SignalandI

2、nformationProcessingName:ZhenfeiChuAdvisor:XiaokangYangSchoolofElectronic,InformationandElectricalEngineeringShanghaiJiaoTongUniversityShanghai,P.R.ChinaJan,2010基于半监督学习的物体识别摘要物体识别是机器学习中的基本问题,解决对文本、图片、视频等数据做分类识别的问题。在数据量较少的情况下,传统的机器学习方法已经取得了很好的效果。但是,随着信息量指数式的增加,获得大量的数据标注

3、已经变得几乎无法完成,这使得传统的机器学习方法在处理这类问题的时候显得力不从心。在这样的情况下,半监督学习方法应运而生,它是使用少量有标注数据的信息,将其扩展到未标注数据上,从而可以解决示例数据和标注数据在数量上严重不匹配的问题。本文阐述了针对难以获得的精确标注和容易获得的粗略标注同时存在的情况下的半监督学习问题,研究了协同训练的鲁棒性问题,即对给定初始标注数据中的错误,对协同训练性能的影响。在协同训练的鲁棒性问题的基础上,本文将信息瓶颈算法和计算后验概率的方法相结合,创新性地提出了一种使用无监督学习方法产生伪标注的方法。与现有方法

4、相比,该方法仅需要较少的标注信息,并可有效降低计算复杂度。在使用伪标注的过程中,本文创新性地提出了一种使用伪标注的协同训练方法。该方法以重排序算法为主要框架,与现有方法相比,此方法对初始的错误标注,具有较高的鲁棒性。在初始标注中存在较多错误时,改进后的方法仍然可以训练出性能较好的分类器。本文在利用伪标注来进行协同训练时,从统计学角度对该方法进行了理论分析,在数学上对该方法在提高协同训练的鲁棒性方面的有效性进行了研究,并探讨了朴素贝叶斯分类和信息瓶颈方法在理论基础上的相似性。关键词:半监督学习,协同训练,伪标注,信息瓶颈理论iObje

5、ctClassificationbasedonSemi-supervisedLearningABSTRACTObjectclassificationisoneofthebasicproblemsinmachinelearning,whichaimingatsolvingtheclassificationandrecognitionproblemontext,image,andvideodata.Inthecaseofsmallamountofdata,traditionalmachinelearningmethodshavealre

6、adyachievedasoundperformace.However,astheexponentialboomingofinformation,itisimpossibletoobtainsuchalargeamountofdatawithlabels,whichleadstoineffectivityoftraditionalmethods.Insuchscenario,semi-supervisedlearningmethodsbecomeahotpointinresearch.Itusessmallamountofdataw

7、ithlabelsandextendsthemtounlabeleddatatofillthequantitygapoflabeledexamplesandunlabeledexamples.Inthisthesis,wefocusonatypicalsemi-supervisedlearningproblemwithsmallamountofhigh-accuratelabelsandlargeamountoflow-accuratelabels.Wealsoproposetherobustnessfactorofco-train

8、ing,whichdenotestheinfluenceofinitialincorrectlabelstoco-trainingprocess.Basedonrobustnessproblemofco-training,weorig

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。