欢迎来到天天文库
浏览记录
ID:23999672
大小:98.00 KB
页数:4页
时间:2018-11-12
《行人检测和跟踪算法理论》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、行人检测和跟踪算法理论行人检测是一个复杂的过程,行人检测框架乜含多个组成部分,木章对其中的关键技术进行分析,如行人检测中的特征提取,对行人特征进行分类的分类器的选择以及主要的行人跟踪方法进行介绍。了解行人检测和跟踪方面的相关技术,为本文提出的行人检测及跟踪的方法提供理论依据。2.1行人检测关键技术行人检测技术主要毡含例个部分,行人检测时的特征提取和对行人进行识别分类的分类器。选取能够对行人准确描述的特征算了对快速准确的检测到行人至关重要,是行人检测中的关键技术,也是能够高效准确检测到行人的前提。选取合适的分类器对提取到的特征进行快速判别,准
2、确的区分出行人与非行人并将行人识别出来乂是行人检测技术的关键部分。2.1.1行人检测特征描述行人检测特征描述是从图像中获取信息并进行信息分析的前期关键步骤。主要体现在特征描述了是否能够高效的描述被检测目标。特征一般是对图像的基木特征如颜色、纹理、边缘等进行组合分析,构建岀更具表达能力的高级特征。1.Haar-like特征Haar-like特征是一种常用的特征描述算子,在计算机视觉领域有广泛的应用。它是由Papageorigioii等人提;11用于人脸检测的描述特征,肜乂延伸到诸如行人检测等许多方面都有不错的检测效果。常用的Haar-like
3、特征主要有线性特征、边缘特征、点特征、对角线特征。如下图所示:Haar-like特征只是选取了一些简单特征对目标特征进行描述,不能够对目标的特征全面表达,因此苏识别程度不高。但haar特征可以使用积分图进行快速计算,检测速度比较快,因此被广泛应用到检测检测行人等其他目标方而。2.HOG特征方向梯度直方图(HistogramofOrientedGradient,HOG)是由Dalai在2005提出的,特征通过计算和统计图像局部区域的梯度方向直方图来构成,在计算机阁像处理屮常作为描述物体的特征算子。HOG特征描述算子的思想是:设定训练样本图像的
4、大小为64*128像素,首先将训练样本分成小的连通区域,即细胞单元(cell),细胞单元的大小为8*8像素,这样在样本阁像屮细胞单元的个数为8X16=128个。然后分别采集细胞单元屮各像素点的梯度或边缘的方向直方聞。最后将这些直方聞进行组合构成特征描述算子。计算图像横坐标和纵坐标方向的梯度,并裾此计算每个像素位置的梯度方向值,图像屮像素点(x,y)的梯度为:Gx(x,y)=H(x+1,y)-H(x-1,y)G、(x,y)=H(x,y+1)-H(x,y-1)G(x,y)=Jcr(x,y)2+G、,(x,y)26Z(x,y)=tan(———)G
5、x(x,y)其中Gy(x,y),H(x,y),60;,力和《0(,”表示对原图像0;,”像素点处的水平方M梯度,垂直方h'd梯度和该像素点的像素值,该像素点的梯度幅度值以及该点的梯度方向。对于划分后的每个细胞单元,细胞的大小为8X8像素。采用9个bin的直方图來统计这8X8个像素的梯度信息,也就是将细胞单元的梯度方句360度分成9个方M块。对细胞单元内每个像素用梯度方H在直方图中进行加权投影(映射到固定的角度范围),就得到了这个细胞单元的梯度方向直方图,就是该细胞雄-元对应的9维特征向量,如图2.6所示。最后把各个细胞单元组合成大的、空间上
6、连通的区间(blocks)。这样,一个block内所宥cell的特征向量申联起來便得到该block的H0G特征。每一个单元格的特征会以不同的结果多次出现在最后的特征向量屮,将归一化之后的块描述符就称之为U0G特征描述算子。与其他的特征描述方法相比,H0G有很多优点。首先,由于HOG是在图像的局部方格单元上操作,所以它对图像几何的和光学的形变都能保持很好的不变性,这两种形变只会出现在更大的空IX!领域上。其次,在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化等条件卜只耍行人大体上能够保持直立的姿势,可以容许行人有一些细微的肢体动作,这
7、些细微的动作可以被忽略而不影响检测效來。因此U0G特征是特别适合于做图像中的人体检测的。因为HOG是一个局部特征,因此对一大幅图片直接提取特征,不能够得不较好的效果。1.LBP特征LBP(Localbinarypatterns局部二值模式)首先由T.Ojala和D.Harwood在1994年提出,用于纹理特征提取,是计算机视觉中用于图像特征分类的一种方法。原始的LBP算子定义为在3*3的窗口内,以窗口屮心像素为阈值,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3*3领域内的8
8、个点可产生8bit的无符号数(二进制编码),将二进制编码转换成十进制,即得到该窗1」的LBP值,并用这个值来反映该区域的纹理信息。如图2.9所示:原始的LBP由于其仅利用3*3邻
此文档下载收益归作者所有