两层哈希的重排序算法

两层哈希的重排序算法

ID:35037033

大小:4.12 MB

页数:70页

时间:2019-03-16

两层哈希的重排序算法_第1页
两层哈希的重排序算法_第2页
两层哈希的重排序算法_第3页
两层哈希的重排序算法_第4页
两层哈希的重排序算法_第5页
资源描述:

《两层哈希的重排序算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、柏;f^y、#戀Sou化ChinaUniversityofTechnology硕±学位论文':-醉ji-‘...V:.i站‘;i'■■:j'::洩;;'’亩两层哈希的重排序算法*\?…声J--/■;7.'V■I作者姓名冯少就萬;I"I学科专业计算机科学与技术嚷j指导教师吴永贤教授苗所在学院计算机科学与工程■■-I??>-’r;j论文提交日期2016年04月三-JI'V-.,I?IJI-j:J?-1._

2、—■.山^."■■■T.......-iRe-rankingwithTwoLevelHashingADissertationSubmittedfortheDegreeofMasterCandidate:FengShaoyongSupervisor:Prof.WingW.Y.NgSouthChinaUniversityofTechnologyGuangzhou,China分类号:TP391学校代号:10561学号:201320130303华南理工大学硕士学位论文两层哈希的重排序算法作者姓名:冯少泳指导教师姓名、职称:吴永贤教授申请学位级别:工学硕士学科专业名称:计算

3、机科学与技术研究方向:人工智能及应用论文提交日期:2016年04月29日论文答辩日期:2016年06月03日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:张星明委员:高英陈琼吴永贤李家春华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加W标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中明确方式标明。本人完全意识到本声明的法律后巧由本人承担。作者签名:端日期:2〇|()年ot月d日学位论文版权使用授权

4、书本学位论文作者完全了解学校有关保留,即;研、使用学位论文的规定究生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校有权保存并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅(除在保密期内的保密论文外);学校可W公布学位论文的全部或部分、汇编学位论文。本人内容,可允许采用影印、缩印或其它复制手段保存一致电子文档的内容和纸质论文的内容相。本学位论文属于;□保密。,在年解密后适用本授权书田不保密,同意在校园网上发布,供校内师生和与学校有共享协议的单位浏览;同意将本人学位论文提交中国学术期刊(光盘版)电子杂志社全文出版和编入CN

5、KI《中国知识资源总库》,传播学位论文的全部或部分内容。"(请在上相应方框内打)备〇3义日期;作者签名:言:2〇|〇^^指导教师签名:^曰期^口3摘要近几十年来互联网发展迅速,特别是在Web2.0的概念提出后,用户生成内容(UGC)指数式产生和积累,这使得一些传统的应用受到了很大的挑战。图像检索是人们在互联网上常常使用的应用,而且已经从基于关键字查询发展到了基于内容的检索。基于内容的检索在实践中往往使用高维度下的近似近邻搜索实现,但是高维近邻搜索在遇到大规模数据量的时候,传统常见的K-D树等算法都不适用于在线查询。而近几年来提出的基于哈希编码算法来近似实现高维近邻搜索在理论和

6、实践都很成功,在于其处理大规模检索问题上依然可以保持次线性(Sub-linear)时间复杂度。基于哈希编码算法在近几年来已经提出了许多算法实现方式,这些算法主要面对的是编码长度和相似度保留的矛盾。使用较长的哈希编码可以尽量保留图像相似度信息,但是长的编码会带来召回率下降和计算量的增长;使用较短的编码使得召回率上升和计算量的下降,但是召回的图像相关性下降严重。现有算法几乎没有直接去解决这个困境,为了处理上述问题,本文提出了两层哈希的重排序算法。通过使用两层不同的查询过程,使得保持高图像相关性的情况下计算量却与使用短编码相当。第一层查询通过本文提出的哈希函数查询敏感映射能力和条件不相似度来优化选择

7、较少的哈希函数实现查询敏感,过滤掉绝大部分不相关样本,由于使用较短编码,处理大规模数据量计算量依然可以接受;第二层查询直接通过使用全长编码作为再次排序依据,由于使用全长编码来排序,不会额外带来多少计算量,与查询相似样本都排在前面,不相似样本排在后面。而且由于只对第一层召回样本进行再排序,计算量大大减少。最后在图像检索领域几个常见的基准数据集上的实验验证了本文提出算法的有效性。关键词:两层哈希;近邻

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。