欢迎来到天天文库
浏览记录
ID:55690760
大小:688.00 KB
页数:19页
时间:2020-05-25
《基于人工神经网络的人脸朝向识别模型.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、基于人工神经网络的人脸朝向识别模型基于人工神经网络的人脸朝向识别模型摘要:人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是模式识别中一个无法回避的问题。本文针对此问题,建立了基于人工神经网络的人脸朝向识别模型。首先,采用基于边缘检测Sobel算子的人脸特征向量提取,把图像转换为6行8列像素值,实现了人脸识别的特征提取,作为神经网络的输入。然后根据实际情况,考虑到误差因素,我们创建一个3层的BP神经网络,输入层8个神经元,输出层3个神经元,中间层17个神经元。选取50张人脸图像中的前30张,作为神经网络的训练样本,通过长
2、达11分钟的训练,我们得到了比较好的网络。接着,把训练好的神经网络用于测试剩余的20张人脸图像,输出的朝向结果与输入的朝向结果完全一致,识别率100%。在BP网络中,由于我们采用了0.01的学习率,虽然识别率很高,但大大延长了网络的训练时间。因此,我们觉得有必要建立一种训练时间和训练效果都较好的神经网络模型。参照模型一,我们接着又建立了基于LVQ神经网络的人脸朝向识别模型二。用于训练的样本和测试的样本都跟模型一相同。与BP神经网络模型相比,不仅大大缩短了训练时间(缩短为1秒),而且保证了识别率为100%。因此,针对人脸朝向识别的问题,采用基于
3、LVQ神经网络的模型更好一些。最后,我们从图像特征提取和神经网络构建两个方面出发,提出了可行的模型改进方法。关键字:人脸朝向识别;BP神经网络模型;LVQ神经网络模型一、问题的重述人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是一个无法回避的问题。现有一组人脸朝向不同角度时的图像数据,图像来自不同的10个人(详见附件),每人五幅图像,人脸的朝向分别为:左方、左前方、前方、右前方和右方。现在需要建立人脸朝向识别模型,对人脸的朝向进行识别。二、模型假设及符号说明1、模型的假设① 所给的全部人脸图像都未出现损坏等问题;② 人
4、脸朝向仅分为5类:左、左前、前、右前、右,其他朝向不予考虑;③ 对于题目中所给的人脸图像,不考虑人脸的复杂表情问题。2、符号说明① N输入层的神经元个数② L隐含层的神经元个数③ M输出层的神经元个数④ X加到网络的输入矢量⑤ H中间层的输出矢量⑥ Y网络的实际输出矢量⑦ 是网络输出单元i到隐单元j的权值⑧ 是隐单元j到输出单元k的权值注:未说明符号在文中用到时注明三、问题的分析人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是模式识别中一个无法回避的问题。基于误差反向传播算法的多层前馈网络可以以任意精度逼近任意的连续函
5、数,所以广泛应用于非线性建模、函数逼近、模式分类等方面。① 人脸识别的首要一步,也是之后所有过程基础步骤,就是人脸特征的提取,即如何把人脸图像转换为数字特征值。目前人脸特征提取的方法有很多,如主元分析法、Fisher线性判别法、小波分析法等。通过特征向量的提取,作为接下来神经网络的输入。② 建立神经网络模型,关键是网络拓扑结构的选择和训练参数的设置。特别是对于BP神经网络来说,参数的设置、样本质量等都是影响结果的重要结果,而学习效率的确定和训练函数的选择直接影响样本的训练时间,还有隐含层神经元个数如何确定等都没有统一的规定。但通过尝试和一些经
6、验公式,完全可以达到很好的输出结果。③ 由于BP网络固有的缺陷和限制,通过该善网络拓扑结构,即采用有导师监督的LVQ网络,可以在保证人脸朝向识别率的基础上,有效的改善训练时间。而且LVQ网络模型具有简单实用的特点,对于本文所讨论的问题来说具有更好的效果。四、基于BP神经网络的人脸朝向识别模型多层前向反馈式神经网络是目前应用比较广泛的人工神经网络,其中BP(BackPropagationnetwork,简称BP网络)学习算法是最著名的多层前向反馈式神经网络训练算法之一。该算法在图像处理和图像识别领域已经取得令人瞩目的成就,其主要思想是利用已知确
7、定结果的样本模式对网络进行训练,然后利用训练好的网络进行图像的处理或识别。本文将首先讨论用MATLAB实现BP神经网络对人脸朝向的分析。4.1基于边缘检测Sobel算子的人脸特征向量提取一个完整的人脸识别系统应该包括人脸检测,特征提取和人脸识别。人脸图像有一些明显的基本特征,如脸部区域通常包括双眼、鼻和嘴等脸部特征,其亮度一般低于周边区域,双眼大致对称,鼻、嘴分布在对称轴上等。本文采用镶嵌图(MosaicImage,又称马赛克图)方法,先将图像划分成一组相同大小的方格,每个方格的灰度取格中各象素灰度的均值,根据一组规则确定可能为人脸的区域,然
8、后将方格的边长减半,重新构建镶嵌图,并根据一组规则分别定位出眼、鼻、嘴等脸部特征。最后,将所前两步所得到的脸部区域二值化,并使用边缘跟踪最终确定脸部特征的位置。物体
此文档下载收益归作者所有