欢迎来到天天文库
浏览记录
ID:23153910
大小:510.06 KB
页数:11页
时间:2018-11-04
《基于深度学习的图像识别处理》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、网络安全技术与应用2017,11,65-67基于深度学习的图像识别处理林杰李如意中国电子科技集团第28研宄所导出/参考文献关注分享收藏打印摘要:近年来,人工智能已经成为了计算机视觉与信息语言交互中的重要研宄对象和热点话题,通过深度学习方法的学习和实践,来进行对图像的处理和描述是十分具冇挑战性的。在这个过程中首先需要构建神经网络,从一端的编码解码结构到另一端的编码解码结构的深度学习模型,并且融合丫图像A标点检测的识别研宄和深度卷积网络相关的记忆模型,从中进行信息提取和学习处理。这种研究方式更加关注原始图像区域的特征显示与其他的多种信息处理模块区域的结合,有助于防
2、止丢失处理信息和主题部分操作过程。在实验过程中通过调取数据集进行实验,通过实验操作成功生成了图像描述系统,依次来对目标进行描述。其结果显示也超出Y综合预期水平。最后再通过多种机器评估的方式來显示该模块处理结果的综合性能。关键词:深度学习;图像识別;CNN;LSTM;SSD;0引言近年来,随着计算机技术的不断发展,人工智能技术的不断提高,深度学习以及人工智能的需求也日益增大。而支撑其发展的大量的计算机资源的研宄。计算机通过对图像的“观察”和“思考”形成自己的认知,通过一套类似于人类的描述语言来进行描述。随着图片的不断革新,图像识别遇到的问题也日益增多,所以图像的
3、描述成为Y对计算机算法要求更为高级的组成部分。图像描述也是对图像识别的进一步认识。这也就是所谓的“多模态”学习过程。1研宄介绍早在1999年就有Y.Mori对计算机阁像识别和描述进行了尝试,只不过建立方法颇为简单,而且自然语言与计算机语言结合不是很完备的条件下无法像正常情况下来建立完整的计算机对图像的描述。A.Farhadi等人于2010年提出了模块映射法,其本身是对空间中图像描述的映射算法,而在2014年Vinyals等人突出/端到端的图像描述NIC模型,通过CNN提取图像特征基于长短记忆语言的生成模型。针对这种生成结构最后进行筛选然后得到较为切合实际的图像
4、识别及后续描述过程。近儿年来图像识别技术在不断的发展,而更多的重心转移到了对图像描述的精确度和自然语言熟悉度的算法研究之中。在语言生成中通过对LSTM现有系统的改进强化了文本可读性,从而有了一些新的进展。2模型介绍2.1模型概述本文通过NIC模型进行改进实验,结合S标检测SSD的方法,提取区域信息,对结构语言进行生成化描述。并且在描述区域借鉴丫ATAE-LSTM模型用以实践。模型阁像处理以一个卷积神经网络来作为阁像处理的主要学习对象使用Incption结构的cnn模型。在这个过程中通过SSD提取尽可能多的图像区域,然后产生一系列的图像集合,在这个过程中选取图片
5、之中的有效信息。模型框图如图1所示。lnceptionV3ImageRegionsAspectd>(%>漏calonatQllOt丁r+LSTMLSTM―LSTWLSTM―*LSTMLSTMLSTM411acatonatotal图1模型框图下载原图模型对输入图像进行特征提取,然后通过SSD来进行图像特征检测,在输出部分来完善工作信息,同样的再次进行特征提取直到最终的自然语言描述能够生成结果。语言生成部分是一个很复杂的环节,首先生成词汇编码并嵌入模块运行中,然后通过LSTM作为运行核心,输入图像元素后进行综合状态评估,然后对语句进行链接,链接的同时载入到LSTM
6、生成器之中。2.2卷积神经网络及特征提取卷积神经网络(CNN)在近年来以一个非常高的发展速度在推动着科学研究,并且应用于计算机视觉之屮产生Y良好的进展。卷积神经网路主要以层级网络形式展开,从卷积层,到池化层,到全连接层等等各部分联系在一起,由于人工神经元的层级划分可以分为提取信息的接收部分和数据中枢的数据特征库,这种方式在图像处理方面应用表现的极为出色。2012年起CNN开发并推广了多种卷积神经网络结构,各个结构部分都有其对应关系和使用维度,输入输出也随之变化。卷积神经网络首先在图像预处理数据集上进行预训练,以保证提取特征的准确度和具备预备习惯。在这个过程中为
7、了避免语言模型的初始训练会对卷积神经网络机构形成破坏,导致神经网络的权重部分无法修复还原,在预学习过程中会选取固定权重的方法来得到一个较好的权重训练结果。而后会根据预训练状况进行一部分调整,这部分被称作细节训练。2.3区域图像提取在处理图像的过程中,对图像中关键信息的处理是尤为重要的,在图像所呈现的信息中将关键信息提取出来是对处理过程中必不可少的部分,相应的对关键部分的信息做出语言生成是描述过程的一部分,这样描述过程才会有明确的主次关系,在语言生成的时候涵盖了图像中全部的内容。在我们所丫解的区域图像提取屮存在着多种提取方式,A前比较常见的是RCNN和两种RCN
8、N算法的衍生算法,是2015年由Gir
此文档下载收益归作者所有