面向海量图像检索的视觉编码方法分析与优化.pdf

面向海量图像检索的视觉编码方法分析与优化.pdf

ID:50145523

大小:6.91 MB

页数:142页

时间:2020-03-06

面向海量图像检索的视觉编码方法分析与优化.pdf_第1页
面向海量图像检索的视觉编码方法分析与优化.pdf_第2页
面向海量图像检索的视觉编码方法分析与优化.pdf_第3页
面向海量图像检索的视觉编码方法分析与优化.pdf_第4页
面向海量图像检索的视觉编码方法分析与优化.pdf_第5页
资源描述:

《面向海量图像检索的视觉编码方法分析与优化.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、面向海量图像检索的视觉编码方法分析与优化张运超2015年12月中图分类号:TP391UDC分类号:004.4面向海量图像检索的视觉编码方法分析与优化作者姓名张运超学院名称计算机学院指导教师王涌天教授答辩委员会主席姜志国教授申请学位工学博士学科专业计算机应用技术学位授予单位北京理工大学论文答辩日期2015年12月AnalysisandOptimizationofVisualCodingMethodforLargeScaleImageRetrievalCandidateName:YunchaoZhangSchoolorDepartment:ComputerScience&Techn

2、ologyFacultyMentor:Prof.YongtianWangChair,ThesisCommittee:Prof.ZhiguoJiangDegreeApplied:DoctorofEngineeringMajor:ComputerScienceDegreeby:BeijingInstituteofTechnologyTheDateofDefence:12,2015研究成果声明本人郑重声明:所提交的学位论文是我本人在指导教师的指导下进行的研究工作获得的研究成果。尽我所知,文中除特别标注和致谢的地方外,学位论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京

3、理工大学或其它教育机构的学位或证书所使用过的材料。与我一同工作的合作者对此研究工作所做的任何贡献均已在学位论文中作了明确的说明并表示了谢意。特此申明。签名:日期:北京理工大学博士学位论文摘要海量图像检索技术是计算机视觉领域研究热点之一。作为一种重要的多媒体搜索技术,它帮助用户在海量图像中快速检索出相关图像。视觉编码的主要工作是将海量图像快速转化成紧凑高效的向量表达,在海量图像检索系统中扮演核心角色,它直接决定海量检索系统的效率以及精度。词袋模型,VLAD,Fisher向量以及稀疏编码等现有主流视觉编码模型为快速准确地进行海量图像检索提供了有力支持。然而上述视觉编码算法也存在一些

4、不足,词袋模型离线训练时间过长;VLAD以及Fisher编码过程没有考虑图像上下文信息;稀疏编码特征集聚算法统计模型较为简单,数学理论解释不充分。因此,针对上述视觉编码算法在码书训练、编码、集聚以及最近邻检索阶段的不足,本文的视觉编码技术分析以及优化研究工作具有重要意义。为分析和优化现有面向海量图像检索的视觉编码方法,本文依次对词袋模型、VLAD以及稀疏编码等视觉编码模型进行理论与实验分析,并结合分布式算法、上下文信息、熵编码理论以及概率统计模型等对上述视觉编码算法进行改进,提高海量图像检索的性能。最后本文在面向海量图像的视觉编码算法研究基础之上构建了一个基于城市级位置服务的移

5、动视觉检索系统。本文完成的主要研究工作包括:1)针对词袋模型训练速度慢,内存消耗大的问题,提出一种基于分布式聚类的词汇树算法训练视觉单词,实现快速准确的码书训练过程。同时提出一种快速的几何重排序算法,利用特征点空间位置信息实现对检索结果的快速几何重排序。2)针对VLAD编码忽略特征点几何信息的问题,提出一种融合重力信息的角度编码以及尺度集聚算法,实现融合上下文信息的VLAD编码。针对乘积量化方法子空间量化误差不均衡的问题,提出基于上下文信息的角度乘积量化方法以及基于熵编码的变长子空间乘积量化方法,分别利用角度子空间以及变长空间维度实现子空间量化误差的均衡。3)针对稀疏编码最大值

6、集聚特征表征不足以及求和集聚受burstiness现象影响的问题,利用概率解释模型提出一种优化的求和集聚算法,实现最大值集聚以及求和集聚的优势融合。同时针对稀疏编码图像检索框架下特征采样以及多特征融合问题进行研究,利用特征采样方法选择的理论分析以及多特征求和集聚实现检索精度的提升。4)搜集构建了一个GPS以及重力信息标注的BeijingLandmark数据库,利用视I北京理工大学博士学位论文觉编码算法理论研究实现城市级位置服务的移动视觉检索系统。视觉编码研究中的理论和实验结果都证明了本文研究工作的准确性以及有效性,分布式聚类、上下文信息、熵编码以及概率解释模型等理论在码书训练、

7、特征编码、特征集聚以及最近邻检索阶段极大地优化了现有视觉编码模型,提高了编码效率及精度,本文最后构建的移动视觉检索系统具有准确高效的特点,已成功应用于国家十二五科技重大专项。关键词:海量图像检索,重力信息,几何信息,乘积量化,稀疏编码II北京理工大学博士学位论文AbstractLargescaleimageretrievaltechnologyisoneofthehottopicsintheareaofcomputervision.Asanimportantmultimediasearcht

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。