欢迎来到天天文库
浏览记录
ID:19652851
大小:53.00 KB
页数:6页
时间:2018-10-04
《基于p2p技术下的信息检索研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于P2P技术下的信息检索研究基于P2P技术下的信息检索研究摘要:21世纪是信息化的世纪。社会信息化程度越高,人们对信息的依赖性就越大。信息是一切思想、事实的富有想象力的表征,它们以各种形式进行记录和传播。信息检索是涵盖了文献检索、情报检索和知识检索的新兴技术。也正是在新科技环境下,P2P技术发展势头强劲,在给万千网民带来便利的同时,正促使互连网的运营方式发生静悄悄的演变,形成新的格局。P2P信息检索将会是通往未来格局的关键技术。正如以Google为首的Web信息搜索引擎对人们冲浪方式带来深刻变化一样,P2P信息检索也将会给未来的互联网带来一场革命。本文从基于P2P搜索的发展
2、动机和原理入手,概述了当前主流的P2P搜索的研究热点和未来几年的发展趋势,以及我们围绕P2P信息检索所作的研究工作。关键词:对等网络P2P;信息检索;向量空间模型;潜在语义索引1、P2P技术概述对等网络(peertopeer,P2P)技术并不是一种新兴的技术,20世纪70年代中期,源于局域网的文件共享,P2P技术就开始流行起来了。目前大家所关注的P2P技术,是原有技术的新应用模式。下面对P2P技术进行简单的介绍。1.1P2P定义P2P是Peer-to-Peer(对等网络,对等计算)的简称,中文译名为对等互联或者点对点技术。在P2P网络中各个节点被称为peer(对等体)。P2P
3、是一种网络模型,在这种网络中所有的节点是对等的(称为对等点),各节点无主从之分,各节点具有相同的责任与能力并协同完成任务。对等点之间通过直接互连共享信息资源、处理器资源、存储资源甚至高速缓存资源等,无需依赖集中式服务器或资源就可完成。业界对于P2P的定义有多种,典型的是Intel公司和IBM公司对P2P的定义。Intel将P2P定义为“通过系统间的直接交换达成计算机资源与信息共享系统”,这些资源与服务包括信息交换、处理器时钟、缓存和磁盘空间等。IBM将P2P定义为:“P2P系统由若干互联协作的计算机构成,且至少具有如下特性:系统储存于边缘化(非中央式服务器)设备的主动协作,每
4、个成员直接从其他成员而不是从服务器的参与中受益;系统中的成员同时扮演服务器与客户端的角色;系统应用的用户能够意识到彼此的存在,构成一个虚拟的或实际的群体”。总之,P2P技术就是在不同用户之间,不通过中继设备直接交换数据和服务的技术。P2P网络中任意节点既可以作为服务器为其它节点提供数据和服务,又可以作为客户机享用其它节点提供的数据和服务。随着P2P的飞速发展,因特网的存储模式将由目前的“内容位于中心”模式转变为“内容位于边缘”模式。1.2P2P技术特点P2P以其独特的技术特点,成为当今文件共享的理想平台。P2P的技术特点主要体现在以下几个方面:(l)分散化:网络中的资源和服务
5、分散在所有节点上,通过各个节点间的合作,直接在节点之间完成内容的传输和服务的实现,避免了中心存储和内容交换可能存在的瓶颈。(2)可扩展性:在P2P网络中,节点在获取资源的同时也为其它节点提供服务。(3)健壮性:P2P有很强的自适应性,天生具有耐攻击、高容错的优点。(4)高性能/价格比:随着硬件技术的发展,个人计算机的计算和存储能力以及网络带宽等性能依照摩尔定理高速增长。采用P2P架构可以有效地利用互联网中散布的大量普通结点,将内容交换、计算任务或存储资料分布到所有结点上。2、信息检索概述2.1、信息检索的含义基于P2P技术下的信息检索研究对于信息检索,主要存在时间性通讯、信息
6、处理和文献查找三种角度的认识:莫尔斯在1950年发表了《把信息检索看作是时间性的通讯》一文,不仅首次提出了信息检索这个概念,并认为“信息检索是一种时间性的通讯形式”。换言之,通过信息检索得到了一些文献,从而使得著者与读者(信息检索的用户)之间建立起了一种通讯。按照这种通讯角度的认识,莫尔斯强调了在通讯双方中,信息发送者必须尽可能发送一切信息,是时间性通讯的被动一方;而信息接受者是主动活跃的一方,正是接受者才决定什么时候接受以及接受什么信息。因此,信息检索的问题就在于,如何把一个可能的用户指向所储存的信息。这种认识突出了用户需求的重要性,对于如何做好信息检索服务工作,至今依然具
7、有很强的理论和实践意义。从信息处理的角度来看,信息检索的基本问题,是如何处理信息和信息的结构。这种认识偏重于信息管理。认为信息不仅限于文献的范围,图像、声音、数据等也都能反映信息,并把信息检索视为计算机科学与技术的一个分支。把信息检索看作是一种信息处理的认识,强调了如何构造以及利用什么形式来构造信息结构的问题。在当今因特网迅速发展,网络信息浩如烟海的情况下,这种认识对于信息检索工具的设计和组建,具有指导意义。从文献查找角度来看,信息检索,简言之,就是查找出含有用户所需信息的文献的过程。在信息检索领域,这
此文档下载收益归作者所有