基于卷积神经网络的视觉识别研究

基于卷积神经网络的视觉识别研究

ID:35062106

大小:3.10 MB

页数:66页

时间:2019-03-17

基于卷积神经网络的视觉识别研究_第1页
基于卷积神经网络的视觉识别研究_第2页
基于卷积神经网络的视觉识别研究_第3页
基于卷积神经网络的视觉识别研究_第4页
基于卷积神经网络的视觉识别研究_第5页
资源描述:

《基于卷积神经网络的视觉识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:10564学号:2013206003分类号:O0235密级:硕士学位论文基于卷积神经网络的视觉识别研究薛昆南指导教师:刘洪山副研究员学院名称:电子工程学院专业名称:机械电子工程答辩委员会主席:王卫星教授中国·广州2016年6月华南农业大学学位论文原创性声明本人郑重声明:所呈交的学位论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者签名:日期:学位

2、论文提交同意书本学位论文符合国家和华南农业大学关于研究生学位论文的相关规定,达到学位授予要求,同意提交。导师签名:日期:学科带头人签名:日期:摘要近年来,卷积神经网络(CNN)凭借其强大的特征学习能力在视觉识别领域取得重要进展,并受到学术界和工业界的广泛关注。首先,本文对CNN的结构进行如下两方面的创新研究:1)针对CNN全连接层对图像平移、旋转、缩放等变换比较敏感的问题,提出了一种混合模型——卷积词袋网络(BoCW-Net)。它将BoW模型嵌入CNN结构中并代替全连接层,通过端到端的方式学习特征、字典和分类器。为实现BoCW-Net整个网络的有监督学习,

3、提出基于方向相似度的BoCW编码。同时,为充分利用中层特征和高层特征的鉴别性,将中层辅助分类器与高层分类器集成,形成主-辅集成分类器。实验结果表明:相比全连接层,BoCW表示对各种变换具有更强的不变性;主-辅集成分类器能有效融合中层、高层特征,提高BoCW-Net的识别性能;BoCW-Net在CIFAR-10、CIFAR-100和MNIST数据库上均取得了改进的识别性能,最终分别获得4.88%、22.48%和0.21%的测试错误率。2)链式结构的CNN虽然能利用表征全局的高层特征解决一般的粗糙分类问题,但没有利用表征局部细节的中层特征解决精细分类问题。因此

4、本文提出另外一种改进模型——卷积词袋-融合网络(BoCW-FusionNet)。它将中层、高层特征的BoCW表示进行级联后再连接分类器,同样是通过端到端的有监督方式学习特征、字典和分类器。实验结果表明:BoCW-FusionNet相比链式CNN获得微小的改进性能,在CIFAR-10和CIFAR-100数据库上分别获得5.36%和24.82%的测试错误率。然后,利用改进的CNN模型(BoCW-Net和BoCW-FusionNet)来解决实际应用问题,包括车型行人识别以及男女性别识别。车型行人数据包含6类车型(客车、轿车、面包车、货车、三轮车以及摩托车)和1类

5、行人的图像,分类准确率分别为98.06%(BoCW-Net)和97.94%(BoCW-FusionNet)。男女性别数据包含男女两类的人脸或头像照片,分类准确率分别为96.20%(BoCW-Net)和94.90%(BoCW-FusionNet)。实际应用表明,改进的CNN模型均获得较好的识别性能。BoCW-Net和BoCW-FusionNet的分类性能比较表明:无论公共数据库还是实际应用数据,中层、高层BoCW表示的主-辅分类器集成方式相比级联方式能有效地融合中层和高层特征。最后,使用BoCW-Net参与Kaggle大数据分析平台上的CIFAR-10I物体

6、识别竞赛和FER2013人脸表情识别竞赛,分别获得95.10%和70.10%的分类准确率,在排行榜上均为第二名。关键词:卷积神经网络;视觉识别;BoW模型;BoCW表示IIConvolutionalNeuralNetworksforresearchofvisualrecognitionXueKunnan(CollegeofElectronicEngineering,SouthChinaAgriculturalUniversity,Guangzhou510642,China)Abstract:Inrecentyears,convolutionalneural

7、networks(CNN)havemadeaprogressinvisualrecognitiontaskswithitspowerfulfeaturelearningabilityandarefocusbybothacademicandindustrialcommunity.First,twoinnovationswereimplementedonCNNarchitecturesinthisword.1)AhybridmodelcalledBoCW-Netisproposedtosolvetheproblemthatfull-connectionlaye

8、rinCNNismoresensitivetoimage’stra

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。