欢迎来到天天文库
浏览记录
ID:23731160
大小:78.68 KB
页数:5页
时间:2018-11-10
《用深度学习技术解决图像语义分割问题》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、电子制作2017,20,39-40+38用深度学习技术解决图像语义分割问题蒋子源浙江省杭州高级中学钱江校区导出/参考文献关注分享收藏打印摘要:大数据技术的飞速发展,使计算机视觉领域面临新的机遇和挑战。传统计算机视觉技术程序复杂,且需要专业知识背景支撑,严重阻碍了该领域的发展。祌经M络技术的出现,人工智能产业的蓬勃发展,使得该领域焕然-新。本人在提炼总结大量参考文献的棊础上,对图像语义分割技术进行概述,并着重对卷积神经网络的的应用做深入剖析。首先就阁像语义分割技术的概念、基本算法和具有应用进行综述,然后对卷积神经网络的发展和基础结构进行详述,之后就卷积神经网络算法如何应
2、用在图像语义分割技术上做介绍,最后对该领域在医学图像和穿衣搭配领域的应用做研究。关键词:阁像语义分割;卷积神经网络;深度学习;计算机视觉;引言图像语义分割技术,即将给定图像的背景和目标物体区分开来,并单独加上语义标签,这在具体的图像处理中非常实用。以往的图像语义分割技术原理是U1,先提取图像本身的特征,之后根据特征划分区域,再在区域上做特征提取,最后分类合并这些区域。其中研究投入最多的是特征提取,如涌现出的经典算法H0G和SIFT,但其处理过程复杂,且并不适用于所有图像问题。神经网络的出现,之所以能够掀起新一波的计算机视觉浪潮,就在于它的“端到端”处理机制,其无需再单
3、独对图像做特征提取操作,多层卷积池化操作模拟人脑,在不断的抽象和迭代中做高层特征提取,再经过全连接层即可进行图像处理。图像语义分割作为子领域,将卷积神经网络应用到其上,自然成为当前的研究热点。2006年以前,超过三层的神经网络模型效率低下,其后,Geoffrey教授在Science上发表的一篇关于深度学习的论文,再次引发了祌经网络的研究热潮。该文章有两大观点:一是多隐含层的神经网络特征学效果突出,能学到图像的本质特征;二是多层神经网络的优化复杂度可以通过“逐层初始化”得到克服。止是这两个核心观点的出现加之研究学者的不断努力,使得神经网络攻克难以训练的危机,再次成为大数
4、据和人工智能时代的主角。1.像语义分割领域发展概述图像语义分割技术大大提高了图像检索的准确率。如根据医学影像做疾病检测方面,图像语义分割技术可以自动提取医学领域关键信息,并依赖分类器做病症预判,最后再经由专业医生做决断,则一方面节省了人力物力财力,另一方面也避免了人为误判等情况的出现。该技术目标不仅仅在于图像分割,在此基础上还增加了新的要求,即语义标注,涉及到技术包括物体边界识别与类别检测。棊于区域的目标检测器,经典框架如下m:一,分割区域。依赖边界检测技术,要求该算法满足强不变性,即阁像本身的亮度、大小、方位等信息并不影响边界检测结果;二,区域描述。依赖特征提取技术
5、,需要提取到多方位特征。一是部分特征。如利用姿势模型提取目标物体形态特征。二是全局特征。包括纹理、颜色等。三是轮廓信息。四是几何特征。包括边界、坐标等特征;三,构造区域分类器。依赖SVM技术,计算各区域得分;四,转化与整合。将上述得分变为像素得分,并做基于像素的分类器,整合分割图。2.卷积神经网络技术原理与应用传统的图像处理技术主要包括特征提取和分类器两部分,特征提取算法的设计复杂性与应用局限性、稳定性,以及特定的特征提取算法与特定的分类器相结合的多样性限制着图像处理技术的发展。神经网络的出现,使端到端的图像处理成为可能,当网络的隐藏层发展到多层吋便称之为深度学但同吋
6、需要用逐层初始化技术解决深层次网络训练难度大的问题,之后深度学习便成为时代的主角。而卷积神经网络(CNN)便是深度学习与图像处理技术相结合所产生的经典模型,实现该模型的网络实例在特定的图像问题处理上都卓有成效。祌经网络之所以能和图像领域相结合,并呈现巨大的发展前景,是有生物学依据的。人类视觉信息处理机制的发现,是19世纪19年代生物学界的重人发现之一,它证明了大脑可视皮层是分级存在的。人的视觉系统是一个反复抽象和迭代的过程。而卷积祌经网络,就模拟了这个过程。首先,每一个卷积层,便是将具体信息做抽象的过程,而多个卷积层串联操作,便是将上一层的抽象结果再做抽象处理的过程,
7、称之为迭代。在这个抽象迭代的过程屮,不断抽取大脑可感知的高维度特征。如当一幅阁像经过视网膜进入视野,首先会将光线像素等信息抽象为图像边缘信息,然后再抽象为目标物体的某一部位,再抽象为物体轮廓形成对整个0标的感知。卷积神经网络包括卷积池化层操作和全连接层操作。该网络基于传统神经网络,主要做/参数数量和训练难度方面的优化。后者各层网络之间采用的是全连接,导致参数数量较多,由此便需要足够多的训练数据才可能达到较好的训练效果,这限制了网络的深度和大小。前者采用局部视野和参数共享机制,大大较少了参数数量。局部视野就相当于人再观察世界时,并不是全局观察,而是分局
此文档下载收益归作者所有