欢迎来到天天文库
浏览记录
ID:9850427
大小:782.50 KB
页数:58页
时间:2018-05-12
《p2p网络的搜索技术研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、中国通信标准化协会课题编号:P2P网络的搜索技术研究2008年9月研究报告要点资源搜索是P2P技术的一个很重要的研究点,搜索方式涵盖了P2P的网络结构、路由算法、索引方式、查询方式和存储分布等P2P技术的多个重要方面。该报告从索引方式入手开始介绍P2P搜索技术。三四章从覆盖层网络结构的角度将搜索方案分为结构化和非结构化的,并分布详细介绍了多种路由算法。第五章介绍了语义的概念,并深入调研了非语义查询方式,此外还有多样化的查询类型,都是解决当前用户的需要的、正进一步深入的研究方向。第六章梳理了现有的搜索方案的存储
2、方式及其负载均衡的情况。(技术工作委员会、工作组名称)TC1-WG4研究单位:北京邮电大学项目完成人:皮人杰、陈辉、吕月梅、乐观、宋美娜项目参加人:王虹、陈墨源完成日期:2008年目录前言6缩略语71P2PSearch概述81.1P2PSearch概述81.1.1P2P技术简介81.1.2P2PSearch的定义81.1.3P2PSearch的分类81.2P2PSearch的研究现状91.3P2PSearch的研究要点101.4P2PSearch面临的问题102索引类型112.1索引概述112.2索引的类型和
3、比较122.2.1本地索引122.2.2集中索引142.2.3分布式索引153非结构化网络下的P2PSearch技术163.1概述163.2现有搜索方法173.2.1Flooding搜索方法173.2.2迭代泛洪193.2.3启发式泛洪203.2.4本地索引法203.2.5Randomwalk搜索方法213.2.6Gnutella2搜索方法213.2.7基于移动Agent搜索方法213.2.8Modified-BFS搜索方法223.2.9小世界模型对搜索技术的影响224结构化网络下的P2PSearch技术22
4、4.1概述224.2常见拓扑结构234.2.1Plaxton树(Pastry,Tapestry)234.2.2环(Chord,DKS)244.2.3Tori(CAN)254.2.4Butterfly(Viceroy)254.2.5Bruijn(D2B,Koorde,距离二等分,ODRI)264.2.6skip图275查询285.1非语义查询285.2语义查询285.2.1关键字查询295.2.2向量模型(PlanetP,FASD,eSearch)的语义检索方案295.2.3隐含语义检索(pSearch)的语义
5、检索方案305.3查询的分类315.3.1范围查询325.3.2多属性查询345.3.3连接查询355.3.4聚集查询356存储366.1P2P存储系统概述366.2容错机制376.3一致性与副本396.4存储负载均衡问题436.4.1结构化P2P系统负载均衡问题446.4.2复制446.4.3地址空间平衡(Address-spaceBalancing)456.4.4结点平衡(NodesBalancing)476.4.5使用虚拟节点(VirtualNodes)476.4.6其他方案486.4.7负载平衡小结4
6、97P2PSearch的标准现状497.1现有国际标准、国家标准和相关行业标准、企业标准497.2标准化建议49参考文献49前言P2P技术作为当前主流分布式应用所采用的一种技术,通过自组织的方式来构建应用系统,充分的利用了网络边缘节点的计算和存储资源,具有很好的可扩展性、健壮性以及避免单点瓶颈的特性。目前也逐渐的为运营商所接受,用来构建未来的核心网络,也体现了该技术在性价比方面的优势。搜索应用作为当前已经比较普及的应用,其价值已被大家广泛认识,这将是用户从互联网海量的信息中获取所需信息的必备工具。当前的搜索应
7、用主要采用“爬虫”从互联网上广泛的获取网站信息,并存储这些资源,然后建立集中式的文件及关键词索引,收到用户的查询请求后将采用特定的查询方式从索引中找到相关的文件信息,根据特定算法计算相关文档的相关度,然后根据相关度排序并将结果返回给用户。这一领域在索引以及查询方式等方面都还在深入研究中,同时目前也存在语义搜索、多媒体搜索等多方面的研究。如何在P2P中进行搜索与现有的互联网搜索相比又是一个有所不同的领域,主要的不同点存在以下几个方面:首先是索引的建立的方式将有所不同,以往的索引都是通过“爬虫”来收集其他主机的资
8、源来建立索引,P2P网络中则不需要“爬虫”来实现网络资源的集中,同时索引方式根据P2P网络组网方式的不同也有不同的建立索引的方式。另外一个不同是在查询的路由方式,现有互联网搜索基于C/S的模式,不需要进行查询的路由,而P2P网络中由于资源的分布式特性,则需要将查询进行路由来进行搜索。最后的不同在于对搜索结果的处理上,对不同节点返回的信息如何进行相关度以及可信度的排序将与现有的C/S搜索存在较大差异。
此文档下载收益归作者所有