【精品】读论文

【精品】读论文

ID:43602348

大小:303.32 KB

页数:14页

时间:2019-10-11

【精品】读论文_第1页
【精品】读论文_第2页
【精品】读论文_第3页
【精品】读论文_第4页
【精品】读论文_第5页
资源描述:

《【精品】读论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、1•基于队员行为信息的体冇视频内容分析方法研究基于机器学习的行为检测关键技术研究上海交通人学硕士学位论文行人检测的难点所在明了行人检测在物体检测领域的特殊性,卜•而就来具体地看看行人检测究竞难在那里。在图1.1-17中我们列出了一些常见的行人图片。这些图片都来源于我们的日常主活,下血所列的各个难点在这些图片中随处可见。第一人难点是人的身材和衣着上的差异性。在衣着上,人的个体差异冃人,每个人的着装根据季节、地区、’市美标准、生活习惯的不同,风格外观迥然不同,给行人检测带來了口大的闲难。例如戴帽子和不戴帽子影响了

2、头部的外观;拎不拎包影响了身体和手部的外观;穿裙子或穿裤子影响了腿部的外观;穿冬装和穿夏装则影响了整体的外观;在身材上,有人高,有人矮,有人胖,有人瘦。这两点造成了行人之间严重的类内差异,给检测工作带來了巨大的挑战。图1.1身材和衣着的差异性Figure1.1differencesofshapeandclothes第二大难点來自人体的动作的多样性。对于刚性的物体,如车辆或者自行车,不管是静止还是运动,其外观都没有显著差异。然而,人体却是非刚性的物体,随着人体的动作,手举起或是放下,人行走或是站立,慢跑或快跑,

3、都能显著地影响行人的外观。这样我们的模型就必须足够的灵活,能够涵盖行人的各种动作给外观带来的变化。图1.2动作的差异性第三大难点來自复杂的背景。我们无法约束行人出现的背呆,背景可能是树木,可能是土地,可能是建筑,可能是车辆,也可能是道路。复杂的背景会在多个方面给行人检测造成困难。有些背景中的物体在形状上上与人体非常相近,如树木,路灯等等,容易造成误报;述有些背采往往在颜色上与行人相近,造成混淆,如黑色的道路与黑色的衣服,使人体的边缘难以检测。第四人难点来自遮扌当。在街道上行人的遮扌%—群人一起行走吋,行人之间

4、也较严重的遮挡时,基于人体全局特征的较多的漏检;基于部位的方法受的影响足够的部位而发生漏检。第五大难点來自视角。视角通常会带來两种变化,平而内旋转和平而外旋转(in-planerotationandout-of-planerotation)«—•般来说,我们关心的行人都是竖直站立的,所以平而内旋转不是我们关心的。平而外旋转则是无法避免的一人问题,虽然行人的正而、侧而的变化并不如人脸显著,但还是有比较明显的影响第六大难点来自光照。在现实世界里,一般是没有办法控制光照的。行人检测要真止地实用,就必须解决好光照强弱

5、带来的变化。因此,许多算法一般都使川局部化的光照均衡来降低光照的影响。第七大难点來自尺度。山于人距离相机有远近之分,人的身材有高矮之别,在同-•张图像里,行人的大小也往往会相差很大。常见的机器学习算法通常都在一个固定的图片大小下进行训练,要检测出各个尺度的行人,就必须采用多尺度的检测算法,大大增加了计算量。总的来说,行人检测而对着种种难点,只有解决好了这些问题,才能获得令人满意的效果。关于行人识别近年來,通过不懈的研究,在行人检测领域涌现了大量优秀的算法,将行人检测的精度一次又一次地提高,向着实用的方向不断迈

6、进。本章将对其中最具有代衣性的儿类算法做i个初步的介绍。第一类算法是称为基于整体特征的算法。这种算法把人看成一个不可分的整体,通常用矩形的包围盒来表示行人。对于一张给定的图片,先对其进行特征提取,如小波特征[1],hog特征⑹等等,再直接用分类器,如支持向量机等,进行分类。这类方法的优点是整个框架比较简单,易于实现。如果提取的特征能有效地描述行人的特点,那么也可以取得很好的效果。但由于将行人作为一个整体來处理,忽略了人体的非刚性,所以这类方法在处理遮挡、不同姿势、视角等方而显得不够灵活。在这类方法中,能否选取

7、有效的特征是成败的关键。由于行人的服饰各异,颜色、灰度和纹理都难以成为稳定的特征,而人体的轮廓恰好受以上种种因素的干扰最小,从而也是最稳定的一种特征。因而在基于幣体特征的算法中,通常把研究重心放在如何更有效地提収以及表示人体的轮廓上。第二类方法称为基于多部位的方法[13](14][16]o该类方法以检测部位为基础,在得到了各个部位的检测结杲后,再分析各部位的相互约束关系來得到最终的结果。这类方法的优点在于能更好地处理遮挡以及行人姿势的多样性。这类方法的主要问题则在于,如何定义部位以及如何整合來口多个部位检测器

8、的信息。第三类方法是基于多视角的方法[27][30]。在人脸检测测领域,侧血人脸和止血人脸通常是分开训练,来减小类内变化,简化训练难度。受到这个思路的启发,也有研究者将不同视角的行人分别处理,以便更好地处理不同视角下行人外观不同的问题。这类方法中的主要研究问题则是:如何不依赖于人的标注口动地分视角学习?其二是如何尽量利川不同视角下的相似性来减小计算量。需耍说明,以上的分类并不相互排斥,例如在基于多部

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。