欢迎来到天天文库
浏览记录
ID:34031438
大小:636.59 KB
页数:37页
时间:2019-03-03
《基于语义p2p技术的网络资源检索系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第一章绪论1.1研究背景及研究意义随着计算机网络的迅速发展,网络中的信息成几何级数爆炸式增长。据权威机构统计,网上约有5500亿的网页。传统检索机制以服务器为中心,用户向服务器发送请求,服务器将检索结果发送给用户(即基于传统Client/Server结构)。C/S机制中,即便有数以万计的Server仍难以满足不断增长的网络终端用户的要求。而且,目前互联网中的资源形式多样、缺乏统一的描述方式,资源的内容以及用户的检索需求不能很好的被机器理解。例如HTML格式的文档,对人来讲很直观、易懂,但这种非结构化的表现形式对机器而言,则完全无法理解,这使信息检索的查全率及查准率很难进一步
2、提高,这就造成了传统的检索机制有信息丢失、返回过多无用信息等方面的局限性,因此有必要对传统检索机制进行改进。近年来,对等网络(Peer-to-PeerNetwork,P2P)的迅速发展受到人们的普遍关注。P2P系统由一组地位平等的节点构成,节点间可以直接相互通信,无须第三者参与。与集中式结构相比,P2P结构在可扩展性、实时性、[1]可靠性和负载平衡方面具有较大优势。基于P2P对等检索理念的技术克服了C/S结构的搜索引擎的弊端,使人们在Internet上的共享行为被提升到了一个更高的层次,能够使人们以更主动的方式参与到网络活动中去。但是,使用P2P网络检索信息时,只是对查询的
3、词语进行机械式的匹配,缺[2]少对信息更深的理解能力。语义Web能够较好的解决以上问题。1998年,万维网之父TimBerners-Lee提出了下一代万维网“语义Web”的概念。语义Web(SemanticWeb)不是一个孤立的网络,而是当前万维网的扩展,是WWW的发展和前进方向,是基于Web的一个完整的体系结构。语义Web的目标就是要建立一个同时满足人类认知理解和计算机理解的知识网络,对网络信息资源[3]实现语义化检索。1.2P2P网络研究现状P2P技术作为计算机科学与技术领域一种革命性的技术,主要用于合理而高效率的组织利用因特网边缘上的大量分布式的计算、存储和信息等资源
4、,充分挖掘Internet所蕴含的大量边缘性资源。现在,P2P网络已经成为发展速度最迅速、最时髦的互联网应用。另外,P2P网络允许用户与用户之间通过Internet直接交互,这样能使网络上用户的沟通交流变的更容易和更直接,从而可以真正消除中间商。可见,P2P网络自我组织性强、可扩展性能好、容错能力也较强,因此P2P网络具有广泛的应用前景。P2P1网络应用所面临的巨大挑战是如何在用户广泛分布、数量宏大、节点的行为不可控制、计算能力和网络的连接不太均匀的复杂情况下实现高效率的搜索服务,目前,国内外各科研机构以及大学对P2P网络的资源检索技术进行了大量的研究,主要包括中心式P2P
5、网、结构化以及非结构化检索技[4]术。1.2.1中心式P2P网络在中心式P2P网络结构中,只有一台中心服务器,该服务器可以用来记录共享资源以及响应对这些资源的查询,可见,此种网络结构具有中心化的特点,但它与C/S结构有着本质的区别。Napste是最早采用中心式网络结构的系统,在Napste中,每一个对等点必须登录至服务器上,使用服务器来维护和保存每一个对等点所共享文件资源的索引信息。Napster把文件查询和文件传输分开执行,当用户想查询到某个文件时,首先必须和Napster服务器相连接,随后检索服务器中的索引信息,服务器会返回保存有此文件的对等点信息,用户直接连到保存有此
6、文件的对等点,直接下载[5]所需要的文件。中心式P2P网络最大的缺点是如果中心服务器坏了,那么整个Napste系统都会被破坏。1.2.2结构化P2P网络结构化P2P网络是P2P网络领域的研究热点,其最大特征是结构化P2P网络都要有一个真正的覆盖网络的拓扑结构,其经常使用的拓扑结构有带弦环、多维空间、蝴蝶形、跳表、超立方体等等。另外,绝大部分结构化P2P网络一般是采用散列表DistributedHashTable(分布式哈希表,DHT)来将结点、数据对象映射到覆盖网络中,为保证这种映射一对一、均衡、随机分布,DHT散列表采用了安全的一致散列函数。可见,在结构化P2P网络,节点
7、路由和定位的方式通常取决于覆盖网拓扑结构和路由表结构这两[6]个因素。2001年由加州大学伯克利分校提出的CAN算法、2001年由麻省[7][8]理工学院提出的Chord算法、Plaxton提出Tapestry算法,都是属于结构化P2P网络。实际上,目前大量P2P网络的实际应用还大都是基于非结构化的泛洪或拓扑广播机制,目前多数采用DHT散列表方式的P2P网络系统缺少在因特网中大规模真实运行的实例,成功的应用还是非常少见。1.2.3非结构化P2P网络所谓非结构化P2P网络,就是在此网络结构中,没有中央索引服务器,所有
此文档下载收益归作者所有