数学在人脸检测中的应用

数学在人脸检测中的应用

ID:30894410

大小:189.04 KB

页数:7页

时间:2019-01-03

数学在人脸检测中的应用_第1页
数学在人脸检测中的应用_第2页
数学在人脸检测中的应用_第3页
数学在人脸检测中的应用_第4页
数学在人脸检测中的应用_第5页
资源描述:

《数学在人脸检测中的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数学在人脸检测中的应用1•引言本学期开设的应用数理统计使我想起了在泰安校区做的本科毕业设计《嵌入式脸谱识别系统》,在该设计里而就有很多算法和思想涉及到数学方而的知识。我们都知道,自从国家实施863计划后,就有了许多针对人脸检测的算法。但是,最经典的还是Adaboost算法,这种算法的人脸检测能力与检测速度都能使人满意。通过典型图形图像处理后,再对OpenCV进行相应的配置进而再结合C++编程就能为视频或图像更复杂的处理搭建很好的理论和软件环境。2.AdaBoost人脸检测算法及JPEG压缩AdaBoost脸谱识别训练算法速度很重要的两方面是特征选取和特征计算。选取的特征为矩特征为H

2、aar特征,计算的方法为积分图。以及对JPEG压缩作简要的表出。2.1Haar-like特征Haar特征分为三类:边缘特征、线性特征、中心特征,组合成特征模板。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。在确定了特征形式后Harr-like特征的数量就取决于训练样本图像矩阵的大小,特征模板在子窗口内任意放置,一种形态称为一种特征,找出所有子窗口的特征是进行弱分类训练的基础。回@05(a)边缘特征(b)线性特征(c)中心特征(a)edgefeatures(b)1inefeatures(c)center-surroundfeatures图1H

3、arr-like特征2.2积分图积分图(IntegralImage)主要的思想是将图像从起点开始到各个点所形成的矩形区域像素之和作为一个数组的元素保存在内存中,当要计算某个区域的像素和时可以直接索引数组的元素,不用重新计算这个区域的像素和,从而加快了计算。“积分图〃能够在多种尺度下,使用相同的时间来计算不同的特征,因此大大提高了检测速度。积分图定义为:其中I(X,,yz)为图像在点(x,,『)处的像素值。为了节约时间,减少重复计算,则图像I的积分图可按如下递推公式计算:(5(x,v)=5(s』一1)+:($,y)ri(xty)=«(x-lty)+5(.v,y)这样就可以进行任意矩形

4、区域内像素积分运算。由图像的积分图可快速地计算图像中任意矩形内所有像素灰度积分。如图2所示,点1的积分图像的值为(其中Sum为求和):运=Sum(,4)同理,点2、点3、点4的积分图像分别为:“2二Sum(.4)+Sum(£?)//5=Suid(4)+Suin(C)«4=Sum(A)+Sum(B)+Sum(C)+Sum(D)矩形区域D内的所有像素灰度积分可由矩形端点的积分图像值得到:Sum(D)=H1+ii4-(w2+H3)2.3Adaboost算法原理Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起來,构成一个更强

5、的最终分类器(强分类器)。Adaboost的具体算法如下:设输入的n个训练样本为:{(xl,yl),(x2,y2)(xn,yn)},其中xi是输入训练样本,yiw{0,1}分别表示止样本和负样本,其中正样本数为I,负样本数为m。n二l+m,具体步骤如下:初始化每个样木的权重:对每个t=l,T(T为弱分类器的个数)①把权重归一化为一个概率分布:“ynm如此使得3t为一个概率分布。②对每个特征f,训练一个弱分类器hj,计算对应所有特征的弱分类器的加权错误率厲二工:3」&(旳)一();)

6、③选取最佳的弱分类器ht(拥有最小错误率):Ot④按照这个最佳弱分类器,调整权重:Wl.i其中Oi=

7、0表示被正确的分类,ei二1表示被错课的分类,当错课分类时:ef最后的强分类器为:A(x)=1•工6儿(.*)N卜X8t«lzHi0■其他情况其中使用HaaMike特征表示人脸,“积分图”实现特征数值的快速计算,再用Adaboost算法挑选出一些最能代表人脸的矩形特征(弱分类器),按照加权投票的方式将弱分类器构造为一个强分类器。将得到的若干强分类器串联组成一个级联结构的层叠分类器,训练得到的强级联结构能有效地提高分类器的检测速度。2.4JPEG的压缩编码人脸的动态视频检测是对视频数据流中的一帧一帧图像的检测,而图像的传输需要编码压缩,我的毕业设计所使用的摄像头是JEPG硬件编码器,

8、所以我在毕业设计指导老师的安排下又学习了JPEG的编码算法。由于学生愚昧,仅学懂一部分知识,所以这里仅对自己略懂的一些做表出。2.4.1离散余弦变换JPEG编码采用的是8*8大小的子块的二维离散余弦变换。它是对图像屮每个颜色的图像分量单独进行的,使用正向离散余弦变换算法之前,先将整体的分量图像单独分成8X8像素的图像块,填充不满足的图像部分可以使用重塑图像的最后一行或者是一列来完成填充,这些图像块被作为二维止向离散余弦变换(FDCT)的输入。图3离散余弦变换JPEG编

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。