资源描述:
《人脸表情识别综述(精品).doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、人脸表情识别综述一、人脸表情识别技术H前主要的应用领域包扌舌人机交互、安全、机器人制造、医疗、通信和汽车领域等二、1971年,心理学家Ekman与Friesen的研究最早提出人类有六种上要情感,每种情感以唯一的表悄來反映人的一种独特的心理活动。这六种情感被称为基本情感,由愤怒(anger)、高兴(happiness)、悲伤(sadness)>惊讶(surprise)、厌恶(disgust)和恐tH(fear)组成人脸面部表恬运动的描述方法…人脸运动编码系统FACS(FacialActionCodingSystem),根据面部肌肉
2、的类型和运动特征定义了垄木形变小兀AU(ActionUnit),人脸面部的各种表情最终能分解对应到各个AU上来,分析表情特征信息,就是分析面部AU的变化情况FACS仃两个主要弱点:1.运动单元是纯粹的局部化的空间模板;2.没令时间描述信息,只是一个启发式信息三、人脸表情识别的过程和方法1>表情库的建立:R前,研究中比较常用的表情库主要有:美国CMU机器人研究所和心理学系共同建立的Cohn-KanadeAU-CodedFacialExpressionImageDatabase(简称CKACFEID)人脸表情数据库;日本ATR建立的
3、丨丨本女性表悄数据库(JAFFE),它是研究亚洲人表恬的重要测试库2、表情识别:(1)图像获取:通过摄像头等图像捕捉工具获取静态图像或动态图像序列。(2)图像预处理:图像的大小和灰度的归一化,头部姿态的矫正,图像分割等。9目的:改善图像质最,消除噪声,统一图像灰度值及尺寸,为后序特征提取和分类识别打好基础生要工作今人脸表情识别子区域的分割以及表情图像的归化处理(尺度归一・和灰度归一)(3)特征提取:将点阵转化成更高级别图像表述一如形状、运动、颜色、纹理、空间结构等,在尽可能保证稳定性和识别率的前提卜,对庞大的图像数据进行降维处理
4、。9特征提取的主要方法有:提取几何特征、统计特征、频率域特征和运动特征等1)采用几何特征进行特征提取主要是对人脸表情的V苦特征,如眼睛、眉毛、嘴巴等的位置变化进行定位、测量,确定其大小、距离、形状及相互比例等特征,进行表情识别优点:减少了输入数据量缺点:丢失了一些重要的识别和分类信息,结果的精确性不高2)基于整体统计特征的方法主要强调尽可能多的保留原始人脸表情图像中的信息,并允许分类器发现表恬图像中相关特征,通过对整幅人脸表情图像进行变换,获取特征进行识别。主要方法:PCA和ICA(独立主元分析〉PCA»用一个正交维数空间来说明
5、数据变化的主要方向优点:具有较好的可重建性缺点:可分性较差ICA9可以获取数据的独立成份,具有很好的可分性基于图像整体统计特征的提取方法缺点:外來閃索的十扰(光照、角度、复杂背景等)将导致识别率下降3)基于频率域特征提取:是将图像从空间域转换到频率域提取其特征(较低层次的特征)主要方法:Gabor小波变换小波变换能够通过足义不同的核频率、带宽和方向对图像进行多分辨率分析,能有效提取不同方向不同细节程侵的图像特征并相对稳定,但作为低层次的特征,不易直接用于匹配和识别,常与ANN或SVM分类器结合使用,提高表情识别的准确率。4)基于
6、运动特征的提取:提取动态图像序列的运动特征(今后研究的匝点)主要方法:光流法光流是指亮度模式引起的表观运动,是景物屮可见点的三维速度欠最在成像平血上的投影,它表小景物表血上的点在图像屮位置的瞬时变化,同时光流场携带了有关运动和结构的半富信息光流模型是处理运动图像的有效方法,其基本思想是将运动图像函数f(x,y,t)作为基本函数,根据图像強度守恒原理建立光流约束方程,通过求解约束方程,计算运动参数。优点:反映了表情变化的实质,受光照不均性影响较小缺点:计算量大(4)分类判别:包括设计和分类决策在表情识别的分类器设计和选择阶段,主要
7、有以下方法:用线•性分类器、神经网络分类器、支持向量机、隐马尔可夫模型等分类识别方法1)线性分类器:假设不同类别的模式空间线性可分,引起可分的上要氐因是不同表情之间的差界。2)神经网络分类器:人I】神经网络(ArtificialNeuralNetwork,ANN)是一种模拟人脑神经元细胞的网络结构,它是山人量简单的基木元件一神经元,相互连接成的自适皿非线性动态系统。将人脸特征的坐标位:甘和戏相应的灰度值作为神经网络的输入,ANN可以提供很难想象的复杂的类间分界面。神经网络分类器主要有:多层感知器、BP网、RBF网缺点:需要人最的
8、训练样木和训练时间,不能满足实时处理要求3)支持向量机(SVM)分类算法:泛化能力很强、解决小样木、非线性及高维模式识别问题方面表、新的硏究热点基本思想:对于非线性可分样本,首先通过非线性变换将输入空间变换到一个高维空间,然后在这个新空间中求取最优线性分界面。这