p2p系统中的信息检索理论及应用的研究

p2p系统中的信息检索理论及应用的研究

ID:33812329

大小:1.36 MB

页数:52页

时间:2019-03-01

p2p系统中的信息检索理论及应用的研究_第1页
p2p系统中的信息检索理论及应用的研究_第2页
p2p系统中的信息检索理论及应用的研究_第3页
p2p系统中的信息检索理论及应用的研究_第4页
p2p系统中的信息检索理论及应用的研究_第5页
资源描述:

《p2p系统中的信息检索理论及应用的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、山东师范大学硕士学位论文摘要P2P系统中的信息检索理论是当前学术界研究的热点问题,随着互联网络技术的发展,网络资源日趋丰富,基于对等网络技术实现对这些资源的组织和管理不但可以作为对传统搜索引擎的有益补充,而且为实现大规模分布式检索提供了一种有效的解决方案。论文分析了影响P2P系统中实现信息检索技术的若干因素,从网络拓扑结构、网络性能分析、资源排序算法以及系统实现这四个方面进行重点研究。经过三年的研究,在阅读大量文献的基础上,取得了一定的研究成果。针对网络拓扑结构,提出一种基于多主题的网络模型构建算法,该算法依据资源类型进行主题划

2、分,能够迅速搜集到网络中的资源信息,可作为信息检索系统的网络组织结构;针对网络性能分析,使用PeerSim模拟器搭建网络平台,从节点利用率、节点数量、自我恢复能力等方面对多主题网络进行性能分析,可为信息检索系统的性能研究提供方法上的借鉴;针对资源排序算法,提出一种基于节点负载的Top-k排序算法,该算法可以有效解决因节点动态性强而引起的传输质量下降的问题;针对系统实现,设计并实现了一个校园环境下的信息检索系统原型,该系统可作为信息检索理论应用的一部分。本文的主要研究内容包括以下几个部分:首先,提出一种基于多主题的网络模型构建算法

3、。针对对等网络中节点自治性强、全局信息缺失的重要问题,提出一种能有效搜集资源全局信息的算法。该算法依据资源的类型将其划分为多个主题,通过周期性的发现算法将具有相同主题的资源信息聚集在一起,形成多个按主题划分的社区,并根据节点能力形成若干个超级节点,进而形成一种具有层次结构的网络模型。由于社区内聚集了网络中同一主题的资源信息,对于特定的查询,只需由超级节点路由到相应的主题社区,就可获得相对较优的检索结果。其次,使用PeerSim模拟器对主题网络模型进行性能分析。对等网络一般具有节点众多,不易搭建真实网络环境的特点,利用网络模拟器对

4、网络结构进行模拟是研究对等网络的重要方法之一。论文选择PeerSim模拟器搭建网络平台,将多主题网络分别与单主题和无主题网络结构进行对比,实验结果表明,该模型不仅能够搜集到近似全局的节点信息,而且具有较快的收敛速度和较强的鲁棒性。接着,提出一种基于节点负载的Top-k排序算法。由于对等网络中节点动态性较强,没有集中控制机制,节点本身及其所处的网络状态不断发生变化,节点间的数据传输质量得不到保证,为此论文研究基于节点负载的排序算法。对网络中节点的负载及网络状况进行预测,将网络负载情况引入到结果的排序算法中。通过与相关算法进行比较,

5、对算法的有效性进行验证,实验结果表明,引入节点负载的资源排序算法,能够有效地提高传输效率和服务质量。最后,设计并实现了一种校园网环境下基于主题划分的信息检索系统。针对校园网环境下信息检索、资源共享问题,设计了一种基于主题划分的实现方案,该方案考虑到校园网资源按照学科、部门分布的特点,将其按照学科、适用对象等进行主题划分,将用户搜i山东师范大学硕士学位论文索限制在主题相关的子网内。该方案采用对等结构作为资源组织方式,集资源检索、共享、管理功能于一体,能够有效地对校园网资源进行管理。关键词:对等网络;信息检索;资源定位;网络模型;主

6、题划分中图分类号:TP393ii山东师范大学硕士学位论文TheTheoryandApplicationResearchofInformationRetrievalinP2PSystemsABSTRACTThetheoryresearchofinformationretrievalinP2Psystemsisahotissueinacademiccirclescurrently.Withthedevelopmentofinternettechnologyandtherichamountofnetworkresources,effi

7、cientsharingoftheseresourcesbasedonP2Ptechnologyprovidesnotonlyausefulsupplementtotraditionalsearchengines,butalsoaneffectivesolutionforrealizationoflargedistributedsearch.SeveralfactorsaffectingtherealizationofinformationretrievalinP2Psystemsareanalyzedinthisthesis,

8、whicharenetworktopology,analysisofnetworkperformance,resourcesortingalgorithmandsystemimplementation.Onthisbasis,weselectthefourkey

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。