欢迎来到天天文库
浏览记录
ID:9797526
大小:332.00 KB
页数:10页
时间:2018-05-10
《小波和余弦变换的人脸识别思路》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、小波和余弦变换的人脸识别思路摘 要:提出了利用小波变换和余弦变换与BP神经网络相结合的人脸识别方法。将人脸图像归一化后进行小波变换,再用余弦变换对低频信号提取特征向量,达到降维和去除干扰的目的,并把特征向量送进BP神经网络训练。识别时,对人脸图像进行相同的变换后,送入神经网络进行辨别。实验结果表明,该算法优于传统的人脸识别法。关键词:小波变换;离散余弦变换;BP神经网络;人脸识别近年来,人脸识别的应用需求日益迫切,在刑侦破案、证件核对、保安监视、医学应用、人机交互系统等方面都有巨大的应用前景,计算机人脸识别技术受到了广泛的重视。目
2、前对复杂环境下的人脸识别提出了更高的要求。人脸识别研究主要有两个方向:一是基于整体的研究方法。该方法考虑了模式的整体性,包括特征脸法、基于SVD分解的方法、人脸等密度线分析匹配法、弹性匹配方法、隐马尔可夫模型方法以及神经网络法等;二是基于特征分析的方法,也就是将人脸基准点的相对比例和其他描述人的脸部特征的形状参数或类别参数一起构成识别特征向量。该方法通过提取出局部轮廓信息及灰度信息来设计具体识别算法。由于神经网络的输入节点很庞大,因此实际训练网络时参数繁多,实现起来很困难,识别速度也相对较慢,但它的优点是可以针对特定的问题进行子空
3、间设计,如神经网络的方法可以用作性别识别等问题。本文提出基于小波变换和离散余弦变换与BP神经网络相结合的人脸识别方法。实验表明,这种方法能快速有效地识别不同人脸,且识别率很高。1小波变换小波变换的概念是由法国从事石油信号处理的工程师J.Morlet在1974年首先提出的,1988年S.Mallat提出了小波多分辨率分析后,为图像模式识别领域提供了一种有效的工具。它是一种信号的时间-频谱分析方法,具有多分辨率分析的特点,而且在时频两域都具有表征局部信号特征的能力。对尺寸为M×N的图像f(x,y)的离散小波变换是:式中,j0是任意的开
4、始尺度,系数定义了在尺度j0的f(x,y)的近似。附加了水平、垂直和对角方向的细节。本文采用哈尔小波作为小波变换。哈尔基函数定义为:对离散小波变换(DWT)采用Mallat人字形算法,即快速小波变换(FWT)[1],如图1所示。小波变换示意图如图2所示。一幅图像经过一次一维小波变换后,可以被划分为4个子块频带区域LL1、HL1、LH1和HH1,分别包含了相应频带的小波系数。LL1频带保持原图像的内容信息,图像的能量集中于此频带;HL1频带保持了原图像的水平方向上的高频边缘信息,人像的眼睛和嘴巴的水平特征比垂直特征明显,而人的丰富表
5、情主要反映在眼睛和嘴巴上,所以HL1描述了人像的表情特征;LH1频带保持了原图像的垂直方向上的高频边缘信息,描述了人像的姿势;HH1频带保持了原图像在对角线方向上的高频信息,这部分对人脸表情变化的反应是最明显的。若对低频子带图像LL1再次进行二维小波变换,则又可以得到四个子块频带区域LL2、LH2、HL2和HH2。图像的大部分信息集中在低频部分LL2上,所得到的水平、垂直和对角方向的高频信号则包含了大量的冗余信息和干扰,在人脸识别中,其作用是非常微小的。如图2(d)直观地表明,当直接对低频分量提取特征时,图像中的有用信息相对集中,
6、因此能有效地降低图像的维数,去掉干扰,从而节省存储空间,提高计算效率。2离散余弦变换离散余弦变换(DCT)是一种常用的图像数据压缩方法,其变换核为实数的余弦函数,因而DCT的计算速度比较快。而且因为频域变化因子u、v较大时,DCT系数的值g(u,v)比较小,而数值较大的g(u,v)主要分布在u、v较小的左上角区域,所以DCT具有很好的能量集中特性,变换后的图像能量主要集中在变换系数的低频分量上,这些低频分量幅值较大,可以用来重建图像。当用DCT系数重建图像时,保留少数离散余弦变换的低频分量,而舍去大部分高频分量,利用逆变换仍可获得
7、与原始图像相近的重建图像,新图像与原图像存在一定误差,但重要信息被保存下来。对一幅M×N的数字图像f(x,y),其离散余弦变换的定义为:式中,g(u,v)为离散余弦变换后的结果,即DCT系数。图3是人脸图像的DCT变换和利用DCT系数重建原图的过程。图3(a)是128×128的原图,图3(b)是离散余弦变换后的结果,图3(c)是利用所有DCT系数进行反变换的重构图像,图3(d)是利用32×32个DCT系数反变换的重构图像,图3(e)是8×8个DCT系数反变换的重构图像。从中可以看出,与原图全部128×128个灰度值相比,图3(e)
8、只用了64个DCT系数,就已经保留了原图的重要脸部特征,很好地表现了原图,这使得数据量庞大的人脸图像可用它的部分离散余弦变换分量来表示,从而实现对高维信息的降维。而且图3(e)把原图人脸的表情和不利于识别的高频噪声信息滤除了,可以更有效地减少高频干
此文档下载收益归作者所有