欢迎来到天天文库
浏览记录
ID:33975167
大小:1.29 MB
页数:79页
时间:2019-03-02
《基于半监督学习的物体识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、申请上海交通大学硕士学位论文基于半监督学习的物体识别学校:上海交通大学院系:电子信息与电器工程学院班级:B0703495学号:1070349179学生姓名:褚镇飞工程领域:信号与信息处理指导教师:杨小康上海交通大学电子信息与电器工程学院2010年1月ThesisSubmittedtoShanghaiJiaoTongUniversityfortheM.S.DegreeObjectClassificationBasedonSemi-supervisedLearningClass:B0703495Speciality:SignalandI
2、nformationProcessingName:ZhenfeiChuAdvisor:XiaokangYangSchoolofElectronic,InformationandElectricalEngineeringShanghaiJiaoTongUniversityShanghai,P.R.ChinaJan,2010基于半监督学习的物体识别摘要物体识别是机器学习中的基本问题,解决对文本、图片、视频等数据做分类识别的问题。在数据量较少的情况下,传统的机器学习方法已经取得了很好的效果。但是,随着信息量指数式的增加,获得大量的数据标注
3、已经变得几乎无法完成,这使得传统的机器学习方法在处理这类问题的时候显得力不从心。在这样的情况下,半监督学习方法应运而生,它是使用少量有标注数据的信息,将其扩展到未标注数据上,从而可以解决示例数据和标注数据在数量上严重不匹配的问题。本文阐述了针对难以获得的精确标注和容易获得的粗略标注同时存在的情况下的半监督学习问题,研究了协同训练的鲁棒性问题,即对给定初始标注数据中的错误,对协同训练性能的影响。在协同训练的鲁棒性问题的基础上,本文将信息瓶颈算法和计算后验概率的方法相结合,创新性地提出了一种使用无监督学习方法产生伪标注的方法。与现有方法
4、相比,该方法仅需要较少的标注信息,并可有效降低计算复杂度。在使用伪标注的过程中,本文创新性地提出了一种使用伪标注的协同训练方法。该方法以重排序算法为主要框架,与现有方法相比,此方法对初始的错误标注,具有较高的鲁棒性。在初始标注中存在较多错误时,改进后的方法仍然可以训练出性能较好的分类器。本文在利用伪标注来进行协同训练时,从统计学角度对该方法进行了理论分析,在数学上对该方法在提高协同训练的鲁棒性方面的有效性进行了研究,并探讨了朴素贝叶斯分类和信息瓶颈方法在理论基础上的相似性。关键词:半监督学习,协同训练,伪标注,信息瓶颈理论iObje
5、ctClassificationbasedonSemi-supervisedLearningABSTRACTObjectclassificationisoneofthebasicproblemsinmachinelearning,whichaimingatsolvingtheclassificationandrecognitionproblemontext,image,andvideodata.Inthecaseofsmallamountofdata,traditionalmachinelearningmethodshavealre
6、adyachievedasoundperformace.However,astheexponentialboomingofinformation,itisimpossibletoobtainsuchalargeamountofdatawithlabels,whichleadstoineffectivityoftraditionalmethods.Insuchscenario,semi-supervisedlearningmethodsbecomeahotpointinresearch.Itusessmallamountofdataw
7、ithlabelsandextendsthemtounlabeleddatatofillthequantitygapoflabeledexamplesandunlabeledexamples.Inthisthesis,wefocusonatypicalsemi-supervisedlearningproblemwithsmallamountofhigh-accuratelabelsandlargeamountoflow-accuratelabels.Wealsoproposetherobustnessfactorofco-train
8、ing,whichdenotestheinfluenceofinitialincorrectlabelstoco-trainingprocess.Basedonrobustnessproblemofco-training,weorig
此文档下载收益归作者所有