视频镜头检测和人体行为分析

视频镜头检测和人体行为分析

ID:38843624

大小:6.83 MB

页数:115页

时间:2019-06-20

视频镜头检测和人体行为分析_第1页
视频镜头检测和人体行为分析_第2页
视频镜头检测和人体行为分析_第3页
视频镜头检测和人体行为分析_第4页
视频镜头检测和人体行为分析_第5页
资源描述:

《视频镜头检测和人体行为分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中山大学博士学位论文视频镜头检测和人体行为分析姓名:吴娴申请学位级别:博士专业:通信与信息系统指导教师:赖剑煌20100603摘要论文题目:专业:学号:博士生:指导老师:视频镜头检测和人体行为分析通信与信息系统07110602吴娴赖剑煌教授要在过去的二十年中,人体运动的视觉分析已经成为计算机视觉领域中一个较为活跃的研究方向,特别是9.1l事件后,其重视程度大幅提高,在虚拟现实、智能监控及身份识别等方面都已具有初步的应用。在人体运动的视觉分析框架中,人体行为的检测与识别研究既是重点也是难点,它是计算机视觉实现从低、中层处理(运动检测、运动目标分类和人体跟踪等)逐

2、步向高层抽象思维(人体行为理解与描述等)转变的关键。然而,目前此研究尚属初级阶段,主要集中在简单场景下标准行为的检测与识别,仍有很多挑战性的问题有待解决。本文首先阐述了人体行为分析(主要包括人体行为检测与行为识别)的研究背景和研究意义,并对已有方法进行了归纳总结。同时介绍了相关的行为数据库,综述了各种算法的评测性能,并引出人体行为检测与识别的若干关键问题,对其发展趋势作了较为详细的探讨。随后分别从镜头检测、行为检测、行为识别三方面展开讨论,提出新算法,并将它们用于解决实际问题。镜头检测是视频分析的基础,也可以广义地看成是人体行为分析的预处理环节。由于镜头变化的

3、形成十分复杂,基于强度、颜色以及形状等低层特征的镜头变化检测经常会发生漏检现象。同时,由于此类特征对噪声、摄像机运动等干扰比较敏感,错检也较为频繁。针对以上不足,本文提出了一种基于空时显著性变化的统计方法用于检测视频中的镜头变化。它融合时间历史帧信息和当前帧的空间信息生成显著图,通过观察空时显著性变化提取相邻镜头之间的差异作为有效特征,在统一框架下,以最小化检测误差为前提,构造统计检测器从而检测出符种类型的镜头变化。在TREC01和各种类型(广告、体育竞技和电影)视频上的评测结果表明了以空时显著性变化差异作为特征的统计镜头检测方法具有~定的优越性。中山大学博士

4、学位论文在行为检测方面,本文提出一种由粗到精的匹配策略以检测出真实视频中较为复杂的人体行为。假设只给定一个查询行为的样本,行为检测是在真实视频中搜索与查询行为相似的所有行为。真实视频通常持续较长时问,若采用穷举搜索的匹配方式,计算花费相当巨大。因此,本文采取由粗到精的匹配策略:首先通过时间和空间分割粗糙地确定最有可能存在查询行为的空时体集合:然后通过分别匹配每个空时体与查询行为之间的结构相似性,检测出真实视频中与查询行为相似的所有行为。实验结果表明,此方法在Weizmann.II库上取得了与穷举搜索法相当的检测率,但由粗到精的匹配策略却使得计算复杂度大大降低。

5、人体行为识别与行为检测既有相似又有不同之处。行为检测一般是指在给定一个查询行为样本的条件下,在真实视频巾检测与查询行为类似的所有行为;而行为识别则是在大量训练样本类别已知的条件下识别未知行为。论文的行为识别工作主要包括前景周期行为的识别和原始周期行为的识别。在背景已知的监控条件下,人体剪影比较容易获取,由每帧剪影图像按时序堆叠起来的空时体则同时包含了人体行为的时间和空间信息。在识别这种前景周期行为的问题上,本文从几何特性(弧长及主轴角度)方面定义了体语义局部二值模式描绘子并直接用于提取其低维特征,在测试行为与已知行为训练集特征之间构造分类器即可识别未知行为。在

6、Weizmann.I库的前景行为数据上,我们取得了95.56%的识别率。同时,测试实验表明,体语义局部二值模式描绘子对视角的微小变化、部分遮挡及行为方式的不规则性具有较高的鲁棒性。体语义局部■值模式描绘子不需要降维,能够直接提取行为空时体中的低维特征,并且提取特征的维数只与局部二值模式事先定义的邻域点个数有关,从而减小了行为之间执行速率的不同对识别率所造成的影响。在原始周期行为的识别方面,本文提出一种正则回归的秩.1张量投影技术。对视频数据采用张量的表达方式既可以保留每帧图像内部的空间结构,又可以避免视频中的二维帧图像转为一维向量而造成的维数灾难。基于张量的分

7、类方法大多采用张量子空间方法首先获取特征张量,进而对特征张量构造合适的分类器,计算较为复杂。本文将多类行为识别问题分解为多个Onevs.All的两类回归问题,对每种行为采用正则回归的方法分别构造秩.1张量投影,通过子集嵌入和后精炼处理将张量样本直接映射到对应的类别标记。在Weizmann.I库和KTH库的分割行为数据和原始行为数据上,我们将秩.1张量投影技术与张量子空间方法及行为识别的最新方法进行比较,获得与其相当甚至更高的识别率。同时,秩.1张量投影技术具有很好的算法收敛性,运行耗II摘要时大为降低,对视角变化、部分遮挡及行为方式的不规则性也具有一定的鲁棒性

8、。关键词镜头检测,行为检测,行为识别,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。