融合多视觉对象的行为识别研究.pdf

融合多视觉对象的行为识别研究.pdf

ID:50145674

大小:3.58 MB

页数:62页

时间:2020-03-06

融合多视觉对象的行为识别研究.pdf_第1页
融合多视觉对象的行为识别研究.pdf_第2页
融合多视觉对象的行为识别研究.pdf_第3页
融合多视觉对象的行为识别研究.pdf_第4页
融合多视觉对象的行为识别研究.pdf_第5页
资源描述:

《融合多视觉对象的行为识别研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、融合多视觉对象的行为识别研究刘婧2015年1月中图分类号:TP391UDC分类号:004.9融合多视觉对象的行为识别研究作者姓名刘婧学院名称计算机学院指导教师吴心筱副教授贾云得教授答辩委员会主席沈建冰教授申请学位工学硕士学科专业计算机科学与技术学位授予单位北京理工大学论文答辩日期2015年1月FusionofMultipleVisualObjectsforActionRecognitionCandidateName:JingLiuSchoolorDepartment:SchoolofComputerScienceFacultyMentor:Prof.XinxiaoWu

2、Prof.YundeJiaChair,ThesisCommittee:Prof.JianbingShenDegreeApplied:MasterofEngineeringMajor:ComputerScienceandTechnologyDegreeby:BeijingInstituteofTechnologyTheDateofDefence:January,2015研究成果声明本人郑重声明:所提交的学位论文是我本人在指导教师的指导下进行的研究工作获得的研究成果。尽我所知,文中除特别标注和致谢的地方外,学位论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北

3、京理工大学或其它教育机构的学位或证书所使用过的材料。与我一同工作的合作者对此研究工作所做的任何贡献均已在学位论文中作了明确的说明并表示了谢意。特此申明。签名:日期:北京理工大学硕士学位论文摘要行为识别是计算机视觉和模式识别领域的热点问题,在智能监控、虚拟现实、高级人机交互等领域具有广阔的应用前景。然而,在真实的、不受限制的环境中,由于人体表观、动作存在差异,背景复杂多变和存在遮挡,摄像机运动等,行为识别仍然是一项具有挑战性的工作。对于发生在真实环境中的行为,物体和场景等上下文信息往往是十分关键的。本文主要研究如何融合多种视觉对象,利用运动、物体、场景等信息联合建模进行

4、行为识别,以提高识别的准确率。本文提出了一种融合多视觉对象信息的联合建模方法,引入含有隐变量的结构化支持向量机框架来建模运动、物体和场景之间的同现关系。模型不仅建模了各个视觉对象与行为类别标签的直接关系,还建模了各个视觉对象之间的同现关系,其中,物体类别标签和场景类别标签被作为隐变量处理。这个模型不仅可以预测出行为类别、物体类别和场景类别,同时还可以定位物体在场景中的位置。实验结果证明了多视觉对象融合的有效性,能进一步提高真实场景中行为识别的准确率。另外,本文采用中层类相关特征来描述多种视觉对象,并提出采用迁移学习的方法训练生成中层特征的预分类器。类相关特征是带有一定

5、语义信息的特征,它由一系列预分类器的判别值组成,衡量了输入视频和相应类别的匹配度。由于训练视频大多数分辨率较低,导致物体模糊不清、场景不易辨认,而且具有上下文信息标注的训练视频十分有限,加重了人工标注训练数据的负担,因此,在训练物体和场景的预分类器时,本文提出采用由图片到视频的迁移学习方法。首先利用有标签的网络图片训练物体和场景分类器,然后采用无监督的区域适应算法,解决图片源域和视频目标域数据分布不同的问题。实验证明了中层特征良好的判别性和迁移算法的有效性。关键词:行为识别;上下文建模;隐结构化支持向量机;中层特征;迁移学习I北京理工大学硕士学位论文AbstractA

6、ctionrecognitionisahighlyactiveresearchinthedomainofcomputervisionandpatternrecognition,andhasamultitudeofapplications,suchasinsurveillance,virtualreality,human-computerinteraction,etc.However,recognizingactionsinrealisticvideosfromunconstrainedenvironmentsstillremainsachallengingproble

7、mduetothelargeappearancevariationsofhumanbodies,backgroundclutterandcameramovement.Inrealisticenvironment,objectandscenecanproviderichsourceofcontextualinformationforanalyzinghumanactions,ashumanactionsoftenoccurunderparticularscenesettingswithcertainrelatedobjects.Therefore,th

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。