欢迎来到天天文库
浏览记录
ID:43963243
大小:62.80 KB
页数:9页
时间:2019-10-17
《基于卷积神经网络人脸识别探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于卷积神经网络人脸识别探究摘要摘要:为解决传统人脸识别算法手工提取特征困难的问题,将卷积神经网络引入人脸识别任务中。为适应ORL数据集人脸识别任务的需要,参照经典的卷积神经网络模型Lenet-5的结构,提出一种适用于该数据集的CNN结构。实验结果表明,所提出的CNN结构具有较少的学习参数,且在ORL数据集上取得了较高的识别率。与传统人脸识别算法进行比较研究,从实验结果可以看出,在识别正确率上,所提出的卷积神经网络结构优于大多数识别算法关键词关键词:人脸识别;卷积神经网络;图像识别;深度学习;模式识别DOIDOI:10.11907/rjdk.171043中图分
2、类号:TP317.4文献标识码:A文章编号文章编号:16727800(2017)0050186030引言人脸识别是近年来模式识别、图像处理、机器视觉、神经网络及认知科学领域的研究热点[12]o所谓人脸识别,是指给定一个静态人脸图像或动态视频,利用存储有若干已知身份的人脸数据库验证单个或多个人的身份口]。作为生物特征识别的一个重要方面,人脸识别有着广泛的应用场景,如:档案管理系统、公安系统的犯罪身份识别、银行和海关的监控、安全验证系统、信用卡验证等领域。在人脸识别巨大魅力的影响下,国内互联网公司也开始了人脸识别应用的探索,如百度推出的人脸考勤系统、阿里支付宝的刷
3、脸登录等功能都是人脸识别的具体应用。目前,人脸识别的代表性方法主要有以下几种:Turk和Pentland[3]提岀的特征脸(Eigenface)方法;基于线性区别分析,Belhumeur等[4]提出了Fisherface方法;基于统计理论,剑桥大学的Samaria和Fallside[5]提出了隐马尔科夫模型[5](HMM),Lawrence等⑹提出的通过多级自组织映射神经网络(SOM)[6]与卷积神经网络相结合进行人脸识别。上述方法虽然获得了良好的识别正确率,但需要人工参与特征提取,然后将提取的特征送入分类器进行识别,过程较为复杂卷积神经网络[79]是近年发展
4、起来,并引起广泛重视的一种高效深度学习识别算法,其已成为当前语音分析和图像处理领域的研究热点。相比传统的神经网络而言,卷积神经网络具有权值共享、局部感知的优点。局部感知的网络结构使其更接近于生物神经网络,权值共享大大减少了模型学习参数的个数,同时降低了神经网络结构的复杂性。在图像处理领域,卷积神经网络的优点体现得更为突出,多维的图像数据可以直接作为网络的输入,特征提取和分类均集成在网络中,避免了传统识别算法中复杂的特征提取和训练分类器过程。除此之外,卷积神经网络对图像中的位移、比例缩放、旋转、倾斜或其它形式的变形具有很好的鲁棒性。为了解决传统人脸识别算法特征提
5、取和训练分类器困难的问题,本文借鉴Lenet-5[10]的结构,设计一个适合ORL数据集人脸识别任务的卷积神经网络结构1卷积神经网络1.1用于ORL人脸识别的CNN本文提出的7层卷积神经网络模型由输入层、2个卷积层、2个降采样层、一个全连接层和一个Sigmoid输出层组成。卷积核的大小均为5x5,降采样层Pooling区域的大小为2x2,采用AveragePooling(相邻小区域之间无重叠),激活函数均采用Sigmoid函数。每一个卷积层或降采样层由多个特征图组成,每个特征图有多个神经元,上层的输出作为下一层的输入。此外,本文实验学习率的取值为常数1.5,该
6、卷积神经网络结构如图1所示1.2卷积层卷积神经网络中的卷积层一般称C层["I特征提取层)b卷积层的输入来源于输入层或者采样层。卷积层中的每一个特征图都对应一个大小相同的卷积核,卷积层的每一个特征图是不同的卷积核在前一层输入的特征图上作卷积,然后将对应元素累加后加一个偏置,最后通过激活函数得到。假设第丨层□棒碗□层则该层中第j个特征图的计算表达式如式(1)xlj=f(XieMjxl-1iklij+blj)(1)这里的Mj表示选择的上一层输出特征图的集合1.3降采样层降采样层是对上一层的特征图进行下采样处理,处理方式是在每一个特征图内部的相邻小区域进行聚合统计。常
7、见的下采样方式有两种:AveragePooling和MaxPoolingo其中,AveragePooling是取小区域内像素的平均值,而MaxPooling是取小区域内像素的最大值。降采样层只是对输入的特征图进行降维处理,不改变特征图的个数。假设down表示下采样操作,pij表示乘性偏置,blj表示加性偏置,则降采样层中某个特征图的计算表达式如下:xlj=f(pljdown(xl-1j)+blj)(2)1.4输出层卷积神经网络的输出层一般为分类器层,常用的有径向基(RBF)函数输岀单元、Sigmoid输出单元和Softmax回归分类器。在ORL人脸识别任务中,
8、采用Sigmoid函数输出单元,输出层
此文档下载收益归作者所有