欢迎来到天天文库
浏览记录
ID:35011075
大小:11.33 MB
页数:154页
时间:2019-03-16
《基于结构和判别语义嵌入的图像表征学习研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、博博博士士士学学学位位位论论论文文文基于结构和判别语义嵌入的图像表征学习研究RESEARCHONIMAGEREPRESENTATIONLEARNINGBASEDONSTRUCTUREANDDISCRIMINATIVESEMANTICEMBEDDING张张张正正正2018年年年3月月月国内图书分类号:TP391.4学校代码:10213国际图书分类号:681.39密级:公开工工工学学学博博博士士士学学学位位位论论论文文文基于结构和判别语义嵌入的图像表征学习研究博士研究生:张正导师:徐勇教授申请学位:工学博
2、士学科:计算机应用技术所在单位:计算机科学与技术学院答辩日期:2018年3月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.4U.D.C.:681.39DissertationfortheDoctoralDegreeinEngineeringRESEARCHONIMAGEREPRESENTATIONLEARNINGBASEDONSTRUCTUREANDDISCRIMINATIVESEMANTICEMBEDDINGCandidate:ZhangZhengSupervisor:Pro
3、f.XuYongAcademicDegreeAppliedfor:DoctorofEngineeringSpecialty:ComputerApplicationTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:March2018Degree-Conferring-Institution:HarbinInstituteofTechnology摘要摘要图像识别是计算机视觉领域的研究热点之一。如何从大规模的高维度视觉
4、数据中获取有效的视觉表征,并且实现视觉信息的高精度、鲁棒、快速识别,已成为图像识别研究领域所面临的、迫切需要解决的问题。图像识别系统的性能依赖于数据表征的选择。具有强判别性的数据表征可以更好地揭示隐藏在观测数据中根本性的有用信息,进而能够明显提升图像识别系统的性能表现。本论文以稀疏表示和低秩表示学习理论为基础,旨在提取对分类或预测有意义的判别性信息来架起低阶高维观测数据和高阶语义知识之间的桥梁,借此分析隐含在数据间的内在规律,提升图像识别模型的鲁棒性和高效性。值得注意的是,强判别性数据表征学习模型应具
5、备以下三个特点:(i)提取较为简洁显著的判别不变性特征,使用简单的分类器获得较高的识别精度;(ii)消除各种噪声等干扰成分,实现可适用于多种任务的鲁棒图像识别;(iii)有效降低视觉表征空间的维度,提升图像识别算法的效率。针对这些特点,本论文提出了一些新的鲁棒图像数据表征学习模型,这些方法在多个图像识别任务上实现了速度和精度的双重提升。具体来讲,本文的主要研究内容介绍如下。面向具有几何对称性的图像预处理和目标识别问题,提出了一种基于结构对称性的鲁棒图像表征学习模型。该模型根据图像的几何结构能够自动产生
6、近似结构对称性的数据表征,并以人脸识别为应用实例探索鲁棒的结构对称性数据表征学习方法,使其适用于几何对称性的目标图像预处理以及基于稀疏表示分类的虚拟字典学习。该模型充分利用人脸结构的轴对称特点,基于梯度下降法来迭代更新左右半边人脸图像,进而产生具有近似轴对称结构的虚拟人脸图像。该方法有以下优势:1)作为一种图像预处理方法,它能够有效地减弱人脸图像中由于多种光照变化所引起的噪声扰动,并增加人脸图像的视觉效果;2)能够自动生成近似轴对称的虚拟人脸图像,克服人脸图像中由于光照和视角变化引起的类内差异大的问题
7、,进而有效解决基于稀疏表示的图像识别算法的缺陷。作为一个无监督的数据表征学习方法,在多个人脸图像数据集上,分别针对人脸图像预处理和虚拟字典学习两个任务做了大量的实验验证。针对传统稀疏表征学习方法存在的不足,提出了一种基于块对角结构约束的判别低秩表征学习模型。该模型在低秩表征学习的框架下,通过提取判别的语义信息来同时减少非块对角元素的噪声表示和强调块对角元素的有效表征,进而增强数据表征的判别性。通过最小化非块对角元素来剔除负面数据表示,并且将非块对角中的有益表示转移到块对角元素中,从而有效地克制了类别间
8、I哈尔滨工业大学工学博士学位论文数据表征的表示噪声,同时提升了不同类别间数据表示的不相干性。构建了一种子空间学习模型来增强训练样本的自表示能力,使所学到的结构化块对角数据表示更具判别性。此外,利用半监督学习模式消除了训练和测试样本间表示学习的鸿沟,保证了训练和测试图像表示间的一致性。为了应对大规模图像识别扩展问题,提出了一种能够有效地处理新样本预测检验的方法。针对基于传统回归模型鲁棒性差的问题,提出了一种基于弹性网正则化约束的回归表征学习框架,进而提出了
此文档下载收益归作者所有