资源描述:
《基于2d-dct和模块2dpca的人脸识别系统的实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于2D-DCT和模块2DPCA的人脸识别系统的实现笪庆1,方超2,单梦凡3DaQing1,FangChao2,ShanMengfan31.南京大学计算机科学与技术系2006级2.南京大学计算机科学与技术系2006级3.南京大学计算机科学与技术系2006级E-mail:cs_stu@tom.comAbstract:WeCombinedwithDiscreteCosineTransform(DCT)andahumanfacerecognitiontechniquecalledmodular2DPCAinthepaper.Firstly,
2、faceimageisturnedintodiagonalimage,anddimensionisreducedbyDCT.ThenimageisreconstructedbyIDCT.Secondly,inthefieldoffacerecognition,TwodimensionalPrincipalComponentAnalysis(2DPCA)hasbeenproposedinwhichimagecovariancematricescanbeconstructeddirectlyusingoriginalimagematrix
3、.IncontrasttothecovariancematrixoftraditionalPCA,thesizeoftheimagecovariancematrixusing2DPCAismuchsmaller.Asaresult,itiseasiertoevaluatethecovariancematrixaccurately,computationcostisreducedandtheperformanceisalsoimproved.Inthispaper,weusemodular2DPCAtoimproveefficiency
4、.First,theoriginalimagesaredividedintomodularimagesinproposedapproach.Then,animagecovariancematrixisconstructeddirectlyusingthesub-images,anditseigenvectorsarederivedforimagefeatureextraction.Keyword:DCT,modular2DPCA,FaceRecognition1引言人脸识别技术在国内外许多领域得到了广泛应用,研究者们提出了许多人脸识别
5、方法。人脸识别中的一个关键问题是特征选择,其基本任务是从许多特征中找出最有效的特征。人脸图像数据量十分庞大,直接用于识别效率不高,因此必须对原始图像进行有效降维.而2D-DCT正是基于压缩的有效的方法。DCT既能有效地降低特征维数,又可以保留对光照、表情以及姿态不敏感的类别信息。但DCT是基于统计表征的,所包含的类别信息不够丰富,因此对DCT系数特征做深入分析,有助于提取识别性能更好的人脸特征与2DPCA相比较,DC变换具有相近的信息压缩表现。DCT系数不仅表达了图像的频率特性,而且可直接从压缩域获得。鉴于此,本文提出将离散余弦变换(
6、DCT)与模块维主元分析(modular2DPCA)相结合的方法进行了一个人脸识别系统的实现。首先,将一幅人脸图像进行DCT变换,再进行压缩并用IDCT完成图像的重建,此时,图像中人眼并不敏感的中频的高频部分已被滤掉。然后,再利用modular2DPCA方法进行人脸特征的提取及模式的识别。2DCT理论与2DPCA2.1 离散余弦变换离散余弦变换是一种常用的图像数据压缩方法,它的压缩质量接近于信息压缩的最优变换(KL变换)。对于一幅M×N的数字图像f(x,y),其2D离散余弦变换的定义为:,其中,u=0,1,2…,M-1;v=0,1,2
7、…,N-1。式中C(u,v)称为DCT系数。a(u),a(v)分别定义为:相应的2D离散余弦反变换(IDCT)由下式给出:其中,x=0,1,2…,M-1;y=0,1,2…,N-1。离散余弦变换的特点是:频域变化因子u,v较大时,DCT系数C(u,v)的值很小;而数值较大的C(u,v)主要分布在u,v较小的左上角区域,这也是有用信息的集中区域。基于DCT系数重建图像时,保留少数离散余弦变换的低频分量,而舍去大部分高频分量,利用反变换仍可获得与原始图像相近的恢复图像,新图像与原图像存在一定误差,但重要信息被保存下来。原始图像重建后的图像2
8、.22D-PCA设X表示m维单位化的列向量,2DPCA的思想是将m×n的图像矩阵A通过线性变换Y=AX投影到上。于是,得到一个n维列向量y,称之为图像A的投影特征向量。设模式类别有c个:ω1,ω2,...,ωc,A1,A