基于多核支持向量机的视频人物自动标注的研究

基于多核支持向量机的视频人物自动标注的研究

ID:21963320

大小:1.69 MB

页数:52页

时间:2018-10-25

基于多核支持向量机的视频人物自动标注的研究_第1页
基于多核支持向量机的视频人物自动标注的研究_第2页
基于多核支持向量机的视频人物自动标注的研究_第3页
基于多核支持向量机的视频人物自动标注的研究_第4页
基于多核支持向量机的视频人物自动标注的研究_第5页
资源描述:

《基于多核支持向量机的视频人物自动标注的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于多核支持向量机的视频人物自动标注的研究THERESEARCHOFBASEDONMULTIPLEKERNELSUPPORTVECTORMACHINEAUTOMATEDNAMINGOFCHAEACTERSINVIODE丁学凯哈尔滨工业大学2010年12月国内图书分类号:TP391.3学校代码:10213国际图书分类号:621.3密级:公开硕士学位论文基于多核支持向量机的视频人物自动标注的研究硕士研究生:丁学凯导师:丁宇新副教授申请学位:工学硕士学科、专业:计算机科学与技术所在单位:深圳研究生院答辩日期:2010年12月授予学位单位:哈尔滨工业大学ClassifiedIndex

2、:TP391.3U.D.C:621.3DissertationfortheMasterDegreeofEngineeringTHERESEARCHOFBASEDONMULTIPLEKERNELSUPPORTVECTORMACHINEAUTOMATEDNAMINGOFCHAEACTERSINVIODECandidate:DingXuekaiSupervisor:AssociateProf.DingYuxinAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceAffiliation:ShenzhenGrad

3、uateSchoolDateofDefence:December,2010Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要随着多媒体技术和计算机网络技术的发展,人们接触到的视频数据以前所未有的速度增长。然而,现有的视频信息处理技术大多数是非智能的操作,远远不能满足海量且内容丰富的视频信息访问和管理的需求,大量的信息不能被有效的利用。从用户的角度分析,他们希望在任何时间任何地方以任意的方式享受视频媒体。与文本、语音等信息的相比,视频中含有大量各种各样的、复杂的有用信息,其内容更加丰富、直观和

4、生动。视频中包括的主要应用包括:人物识别。确定谁在屏幕中出现;动作、物体识别和表情估计,判断视频中的人物在做什么和这个物体是什么;场景理解,判断某个地方发生了什么事情;语义理解、内容分析。本文首先概要介绍了视频人脸特征定位与人脸描述符提取,分析了基于局部特征提取人脸描述符的优缺点,结合基于全局人脸描述符的特点,提出了一种新的综合的人脸描述符特征。分析提取视频中人物衣服特征的缺点,引入新的头发特征。对最近邻分类器和支持向量机分类器进行分析对比,提出了一种基于多核支持向量机的分类算法。本文的研究内容及主要工作包括以下几个方面:为进一步提高分类的准确率,去除原有的衣服颜色特征,新引入头发颜色特

5、征作为多核分类器的一个基本核。(2)研究人脸的全局特征与局部特征相互结合后对分类效果的影响。并进行相应的实验比较。(3)对现有的人脸序列的分类算法优进行了分析,并新引入多核支持向量机分类器,进行实验比较。关键词:视频索引;自动标注;人脸识别;I哈尔滨工业大学工学硕士学位论文AbstractWithmultimediatechnologiesandcomputernetworktechnologydevelopment,peopleexposedtothevideodataatanunprecedentedrate.Weinvestigatetheproblemofautomaticall

6、ylabellingappearancesofcharactersinTVorfilmmaterialwiththeirnames.Thisistremendouslychallengingduetothehugevariationinimagedappearanceofeachcharacterandtheweaknessandambiguityofavailableannotation.MoivesandTVarearichofdiverseandcomplexvideoofpeople,objects,actionsandlocates‘inthewild’.Thisprovide

7、suswithrealisticdataforunderstanding,withmanyapplicationtocomputervisionandmachinelearning.Forexample,whoisonscreen;whattheyaredong,andwithwhatobjects,action&objectrecognitino,poseestimation;wherethingshappens;semantic

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。