视觉印象深度学习算法研究

视觉印象深度学习算法研究

ID:35097177

大小:4.78 MB

页数:119页

时间:2019-03-17

视觉印象深度学习算法研究_第1页
视觉印象深度学习算法研究_第2页
视觉印象深度学习算法研究_第3页
视觉印象深度学习算法研究_第4页
视觉印象深度学习算法研究_第5页
资源描述:

《视觉印象深度学习算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代号;10285難—-i’-:--号;20134027007^学■襄W火考SOQCHOWUNIVERSITY一^Hh视觉印象深度学习算法硏究^ResearchonDeepLearningAlgori化mwkhVisualImpression研究生姓名杨梦锋B指导籍脱李凡长|专业名称软化程1^?研究方向李群机器学习所在院部计算机科学与技术■?=苏州大学学位论文独创性声明本人郑重声明:所提交的学位论文是

2、本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含其他个人或集体已经发表或撰写过的研究成果,也不含为获得苏州大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。论文作者签名:日期:2016年12月29日苏州大学学位论文使用授权声明本人完全了解苏州大学关于收集、保存和使用学位论文的规定,即:学位论文著作权归属苏州大学。本学位论文电子文档的内容和纸质论文的内容相一致。苏州大学有权向国家

3、图书馆、中国社科院文献信息情报中心、中国科学技术信息研究所(含万方数据电子出版社)、中国学术期刊(光盘版)电子杂志社送交本学位论文的复印件和电子文档,允许论文被查阅和借阅,可以采用影印、缩印或其他复制手段保存和汇编学位论文,可以将学位论文的全部或部分内容编入有关数据库进行检索。涉密论文□本学位论文属在年月解密后适用本规定。非涉密论文论文作者签名:日期:2016年12月29日导师签名:日期:2016年12月29日视觉印象深度学习算法研究中文摘要视觉印象是储存在人们记忆中的视觉信息,它是视觉认知过程中

4、的一种重要形式。人类通过视觉获得的感官刺激,经由大脑的信息处理之后,形成有关认知客体的形象。这个形象以记忆的形式储存在脑海中,构成能够帮助人类理解与认知的视觉印象。视觉印象是人类大脑能够准确高效地完成各种各样复杂任务的基础。大脑在大部分时候直接借助于记忆中的视觉印象帮助视觉信息的处理,而不是通过盲目地计算。由于人类在认知客观事物时,八成以上的信息都来源于视觉并且在进行目标识别等任务中,人们总是通过已有的视觉印象去认知当前的事物,因此研究视觉印象机制对于模式识别、计算机视觉等领域具有重要的作用。深度学

5、习通过堆叠单层模块构建一种深层的非线性网络,能够实现对复杂函数的无限逼近。深度学习能够以非监督的形式逐渐学习出不同抽象级别的特征,提供一种更具表现力的分布式表示方式。由于其自动学习特征的特性,使得相对于传统特征选择方法来说,深度学习节省了人工设计特征的代价。深度学习高度有效的特征提取方式,使其在目标识别等领域的应用都带来了突破性的结果。人类视觉皮层具有一个深度的结构。从模拟生物机制的角度,这成为支持深度学习技术的一个强有力的证据。从某种程度上,深度学习对人类逐层进行的认知过程进行了模拟。人脑的深度结

6、构决定了视觉印象是对视觉信息逐步抽象的过程。这意味着逐层抽象的视觉印象能够与深度学习逐层提取的隐藏特征相对应。因而,将视觉印象机制与深度学习技术相结合是十分有潜力的研究方向。如何利用深度学习方法模拟人类视觉认知过程中产生的视觉印象是一个亟待解决的问题。这个问题要求设计的深度学习算法一方面要能够体现视觉印象的一些特点,另一方面也要能够完成视觉印象的相关功能。在深度学习的基础上,如何能够有效地提取出具有层次结构的视觉印象以及如何保证获得的视觉印象对微小扰动的鲁棒性,都是在设计深度学习算法时需要面临的主要

7、问题。I视觉印象深度问题是深度学习的核心问题之一,本文针对视觉印象深度问题的层次特征和稳定特征等方面进行研究,取得的成绩主要包括:第一,本文在视觉印象的基础上,提出了两种视觉印象模型:再认模型和泛化模型用来模拟人类视觉系统的认知过程。本文给出利用一个深度神经网络学习到的视觉印象如何能够被有效地迁移到其他视觉认知任务中。通过复用以非监督的方式训练得到的隐藏层,提出的算法能够在目标任务中大幅度地减少需要被标注图像样本的数量。实验证实了在源任务中估计的参数的确能够帮助网络在目标任务中提高目标分类的结果。第

8、二,本文利用视觉印象给出一个用于训练拓扑深度神经网络的全新的方法。通过结合降噪自动编码器以及带有Hessian正则化项的收缩自动编码器,能够获得一个对输入数据的小幅度变化十分鲁棒的自动编码器。利用切传播算法来展示本文提出的方法如何能够捕获视觉印象的流形结构并且建立一个拓扑图册的图集。然后,利用学习到的特征去初始化一个深度网络,使用相对于其他模型更小的参数集合获得了更好的分类结果。第三,给出了本文开发的一个捕获视觉印象李群流形结构的新算法。通过设计单层李群模型,验证该表

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。