欢迎来到天天文库
浏览记录
ID:37103872
大小:6.22 MB
页数:72页
时间:2019-05-17
《面向大规模多媒体检索的深度哈希学习方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、面向大规模多媒体检索的深度哈希学习方法研究(申请清华大学工学硕士学位论文)培养单位:软件学院学科:软件工程研究生:朱晗指导教师:王建民教授二〇一七年五月DeeLeatoHashforLar-rnineScalepggMultimediaRetrievalThesisSubmittedtoTsinhuaUniversitgyinartialfulfillmentofthereuirementpqforthedereeofgMasterofScienceinSoftwareEngineeri
2、ngbyZhuHanThesisSuervisor:ProfessorWanJianminpgMa2017y,摘要摘要随着互联网上多媒体数据的日益丰富一,如何实现高效及精确的检索成了个重要的问题。由于在检索效率和存储空间方面的优势,哈希方法近年来受到了学术界和工业界越来越多的关注,并被广泛应用于大规模多媒体数据的近似近邻查询中。大多数现有的哈希学习方法,首先会使用人工定义或学习得到的特征来表示多媒体数据,然后通过另外的哈希学习过程来生成最终的二值化哈希码。这类将特征抽取过程和哈希学习过程分开的方法一,有些明显的缺陷。首先,由于
3、哈希一码具有离散性,所以大部分哈希学习方法首先会学习得到个连续压缩表示,然后通过量化函数来将连续的结果变成二值化的哈希码。然而,在二值化的过程中,量化误差通常会被忽略一定的差,这导致哈希学习的目标和最终的编码之间存在异。其次,由于分离了特征抽取步骤和哈希学习步骤,特征表示本身的质量,成了限制哈希编码表达能力的天花板。为了解决哈希学习中现存的问题一,本文提出了个深度哈希框架,来进行多媒体数据的哈希编码学习。相比于传统的方法,本文提出的深度哈希框架有三点?>优势,由于深度网络能够进行特征学」,深度哈希方法能够提供从原始多媒。首先体数据到哈希码的端到端学习方式,
4、这解决了特征表示和哈希编码协同优化问题。其次,得益于深度神经网络强大的拟合能力,深度哈希方法能够学习得到高质量的从连续特征表示到离散哈希编码之间的非线性哈希映射函数,让哈希码尽量保持原始数据之间的相似关系,。最后本文在深度哈希框架中提出了量化损失的概念,让深度网络在训练过程中能够缩小连续的压缩表示和二值化的哈希码之间的差异,从而极大地提升了哈希码的表达能力和压缩比例,。此外本文在上述深度哈希框架中,利用贝叶斯估计创新性地提出了深度哈希网络(DeepHashingNetwork,DHN)方法,来解决图片数据的哈希编码学习及大规模检索问题。最后,本文在Caff
5、e和TensorFlow两个主流的深度学习框架中,实现了提出的DHN一深度哈希框架及深度哈希网络)方法,并通过系列的实验,证明了提出(的方法比之前的工作取得了显著的多媒体检索准确率的提升。:关键词深度学习;哈希学习;相似性检索;压缩编码IAbstractAbstractRetrievingfromtheincreasingscaleofmultimediadataontheInternetefficientlyandaccuratelisanimortantroblem.Duetothestoraeandretrieva
6、lefficienchashinyppgy,gmethodsarereceivingattentionrecently,andhavebeenwidelyadoptedtoapproximatetihbohtl-lltiitilnearesnegrsearcsysemsforargescaemumedarereva.Formostexistinghiththltiidtisfitlttf-ashnmeodsemumedaaarsreresenedasvecorsohandcraftedorg,ypmac
7、hine-learnedfeaturesfollowedbasearatesteoflearnintohashthatenerates,yppggb-inarcodes.Neverthelessthesetwostemethodshaveseveraldisadvantaes.Firsty,pg,becauseofthediscretenatureo
此文档下载收益归作者所有