基于map-join-reduce预处理的外观专利图像检索方法

基于map-join-reduce预处理的外观专利图像检索方法

ID:33100798

大小:1.89 MB

页数:68页

时间:2019-02-20

基于map-join-reduce预处理的外观专利图像检索方法_第1页
基于map-join-reduce预处理的外观专利图像检索方法_第2页
基于map-join-reduce预处理的外观专利图像检索方法_第3页
基于map-join-reduce预处理的外观专利图像检索方法_第4页
基于map-join-reduce预处理的外观专利图像检索方法_第5页
资源描述:

《基于map-join-reduce预处理的外观专利图像检索方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:UDC:密级:学校代号:11845学号:2ll0903057广东工业大学硕士学位论文(工学硕士)基于Map-Join-Reduce预处理的外观专利图像检索方法朱健伟指导教师姓名、职称:夔壹云塾援学科(专业)或领域名称:值曼生信息处理学生所属学院:值:亟王猩堂院论文答辩日期:2Q12生鱼旦圣旦\\呲Y帆2吣0叭9舭7㈣眦4眦2l\\\5帆ADissertationSubmittedtoGuangdongUniversityofTechnologyfortheDegreeofMasterofEngineeringSciencePretreatmen

2、tDesignMethodbasedonPatentImageRetrievalMap-Join-ReduceMasterCandidate:ZhUJianweiSupervisor:Prof.DaiQingyunJURe2012SchoolofInformationEngineeringGuangdongUniversityofTechnologyGuangzhou。Guangdong.P.R.China.510006,摘要摘要外观专利图片包含着丰富的视觉信息,但是由于数量巨大,检索范围很大,若只靠人工识别,工作量非常大而且效率很低。然而,图像检索是

3、数据密集型的计算过程,而在检索过程中将消耗大量CPU的资源,所以,系统引入了Hadoop框架的这一种分布式计算模型,经过实践,的确比原有的B/S单节点架构的图像检索系统提高了检索效率,当中的把图像检索技术应用子MapReduce并行计算框架也解决了数据量快速增长导致增加系统负载而降低系统的实时性和并发性能差、不能处理大规模的数据等这些问题。MapReduee在处理多重数据集上,不能实现一次聚合所有数据集,每个MapReduce的中间结果都要作检查和shuffle操作来避免产生错误,系统实时性遭遇到瓶颈。Map.Join.Reduce这一扩展式的编程模型

4、预处理方法可一次性地运用在多重数据集中,简化了数据分析任务,加速检索速度。Map.Join.Reduce是对MapReduce的一个扩展式编程模型,适用于多个数据集的混合运算处理,而且Map.Join.Reduce和MapReduce它们可以随意进行输入输出链式连接处理。该系统把主要的图像特征数据和著录信息数据使用Map.Join.Reduce作混合分布式处理。由于这两个数据集有一定的关联性,使用Map.Join.Reduce作混合分布式预处理,能够简化数据量,压缩搜索量,从而提高检索的效率。Map.Join.Reduce首先把两个数据表中拥有某一个著

5、录信息的记录条目使用Map任务把它们都找出来,然后再以表中的专利号作为桥梁,使用Join任务把两个表合并最后Reduce输出,并给后面链式连接的MapReduce程序作检索操作。实验结果表明,该方法能够像原有MapReduce系统那样,均衡系统负载,提高资源利用率,有效降低了在大数据集上进行图像检索的时间,且相对于基于MapReduce的检索方法,能够进一步提高检索效率。关键词l云计算:Hadoop:Map-Join-Reduce:分布式处理:图像检索广东工业大学硕士学位论文AbstractThepatentdesignimagescontainlot

6、sofvisualinformation.Itisaheavytaskandalowefficientworkthroughbyartificialidenti行cationinimageretrieval.However,imageretrieval,whichisadata-intensivecomputingprocess,consumehighCPUusageratewhenimageretrieving.SothesystemimporttheHadoopstructurewhichisadistributedcomputingmodel.C

7、omparedwiththeB/Ssingle-nodeimageretrievalsystem,retrievalefficiencyhasbeenimproved.CombiningMapReducepaiallelcomputingframework,imageretrievaltechnologysolvesmanyproblems,suchasthelowinstantaneityandconcurrencyproblemscausedbyhighsystemloadandlowcomputingvolumeproblem.Inhandlin

8、gmultipledatasets,MapReducecannotgatherallofdat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。