欢迎来到天天文库
浏览记录
ID:35057688
大小:2.80 MB
页数:47页
时间:2019-03-17
《基于mapreduce的图像检索的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、单位代码10475[I1’.耳-、'.学号104754140882言:-分类号了歴I杂儀^:皆杂乂聲胃硕±学位论文(专业学位)基于MapReduce的图像检索的研究与应用m-MiM:z.於.y;|‘'識..v.茂翁/_专业学位领域:计算机技术一专业学位类别^:工程硕±专A申请人;王晓巧指胃教师:徐粮胃级X程师氧;二。-六年五月;:;議.片-'片;.:若S杳卷聲為片.1>'.?巧
2、取:讀蛇T^心STUDYONIMAGERETRIEVALONMAPREDUCEANDITSAPPLICATIONSADissertationSubmittedtotheGraduateSchoolofHenanUniversityinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringByWangXiaodanSupervisor:Prof.XuBinMay,2016I摘要在现代数据信息快速增长的年代,互联
3、网上的信息量成倍的增长,图像信息也逐步增多,这对我们信息扩充的同时,也给我们信息图像的检索带来了影响,因此如何快速而精准的从大量的数据中检索出我们所需要的数据信息,成为了当前工作者所钻研的热门的问题。随着人们对图像检索的深入研究,从而诞生了不单单基于关键字的检索方式,其中基于内容的检索方法因其检索的准确率而逐步得到重视。本文主要研究在MapReduce上的图像检索算法。将图像数据存储在HDFS上,通过MapReduce对图像建立索引,从而实现图像的检索。本文主要是利用SIFT算法对图像进行特征的
4、提取,将其特征向量映射到LSH算法上,通过局部特征对图像进行哈希计算,利用汉明距离法对图像的距离进行计算,对其建立索引,通过MapReduce的框架模型实现该算法,从而检索出图像。本文通过对大数据处理框架Hadoop的研究,深入研究HDFS和MapReduce的特性,结合MapReduce和基于SIFT特征的LSH算法,快速响应并且有较好的检索结果。最终,形成一套可以用于生产的高可用海量图像的检索框架。关键词:图像检索,HDFS,MapReduce,SIFT,LSHIABSTRACTInthea
5、geofrapidgrowthofmoderndatainformation,theamountofinformationontheInternetisgrowingrapidlyaswellasimageinformation.Itexpandsourinformation,whileinfluencestheimageretrievalatthesametime.Soitbecomesahotproblemthathowtoretrievaltheinformationweneedfroml
6、argeamountsofdataquicklyandaccuratelywhichcurrentresearchersareworkingon.Withpeople’sdeeplearningintoimageretrieval,theretrievalapproachbasedonnotonlykeywordsisborn.Andtheretrievalapproachbasedonthecontentgetreappearedbecauseofitsretrievalaccuracy.Th
7、ispaperstudiesimageretrievalalgorithmonMapReduceprincipally.ImageretrievalisachievedbystoringimagedataonHDFSfirstlyandcreatingindexofimagesbyMapReduce.ThealgorithmSIFTismainlyusedtoextractfeatureofimagesandthenmapitsfeaturevectorstoLSHalgorithm.Hashc
8、alculationofimagesisconductedthroughlocalfeatures,Hammingdistancemethodisappliedtocalculatethedistanceofimages,theindexneedstobebuiltaswell,thealgorithmcanberealizedthroughMapReduceframeworkmodelandtheimagewillberetrievedafterthat.Inthispaper,bigdata
此文档下载收益归作者所有