欢迎来到天天文库
浏览记录
ID:47210163
大小:60.60 KB
页数:11页
时间:2019-08-27
《几种网络信息资源宏观组织方式的比较分析[修订]》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、几种网络信息资源宏观组织方式的比较分析摘要介绍了5种主要的信息资源宏观组织方式及其优缺点。这些组织方式是:以关键词为检索入口的搜索引擎方式;以知识内容为检索结果的信息组织方式;以管理元数据为目的的信息组织方式;以异构系统的开放互连为目的的信息组织方式;以计算机可以支持语义的、智能化检索为目的的信息组织方式。关键词网络信息组织搜索引擎学科信息门户数字图书馆XML信息组织元数据登记系统语义网网络信息资源存储着來自全球的信息资源,由于网上信息的建设者分布于不同的国家、不同的地区,有着不同的建设目标、方式和手段,处于不同的信息技术发展
2、的环境,因此没有,也不可能有一个统一的领导、协调机构来负责网络信息资源建设的全球规划和管理。其结果是每一个网站的信息资源建设选择标准、检索方式、界面设计、硬件、软件等都不同,形成了信息孤岛。而这种宏观上信息组织的无序状态又加剧了信息选择的困难。因此,宏观信息组织研究和开发成为网络信息资源组织研究的热点。笔者选择具有代表性的网络信息宏观组织方式分别加以比较分析,以便揭示不同组织方式的优劣,对网络信息资源的组织提供不同的研究视角。1搜索引擎体系的信息组织方式1.1以关键词为检索入口的搜索引擎它的工作方式是通过网络搜索软件或网络登陆
3、方式,将因特网上大量网站的网页信息收集到本地机,经过口动加T处理建立信息数据库和索引库,从而对用户提出的各种检索作出响应,提供用户所需的信息和相关链接。其构成主要由网络搜索软件、数据库和检索代理三部分组成。搜索引擎检索的原理是,用户输入关键词与网站或网页的关键词匹配实现检索。它的优点是:从网络信息的采集到加工、检索过程都采用用计算机自动处理方式,制作成本低,易于管理和维护,不需人工干预。它是目前检索因特网、新闻小组、GOPHER、FTP、图像、音频、视频信息的最主要的检索工具。检索方式简便是它的特点。它的不足是:由于它采用关键
4、词匹配检索,用户查找同一内容,会因使用不同的检索词而得到不同的检索结果;而对于同一内容,一旦用户选择某一个检索词,其它与该检索词同义的检索结果又容易被漏检,降低了查全率。在某些基于全文的搜索引擎中,把文屮出现的词与用户输入的关键词相匹配作为检索结果,会产生大量的误检,因为文中的词有许多并不代表网页的主题或内容,结果降低了查准率。1.2以网络资源目录(或网络资源指南)为检索入口的搜索引擎为了克服以关键词为检索入口的不足,一般的搜索引擎还另外增加了网络资源目录为检索入口,以提高查准率。网络资源目录是基于人工建立的网站分类目录,是网
5、站的分类链接列表。它们通过人工浏览因特网页面,根据一定的标准(不同的指南选择的标准有别)来挑选所要链接的资源,然后将各种资源按一定的分类体系组织,并辅之以年代、地区、主题等分类,形成分类树结构冃录。它通过搜索引擎主页而的网络目录揭示其第一级类目名,具有形象直观的特点,下级类目通过层层点击实现查找功能。用户不用自己构造检索词,也不用输入检索词,只要选中某一个所需要的类目点击鼠标左键即可进入该类目。它的优点是:首先克服了以关键词为检索入口的不足。其次,网络资源冃录因其是经过人工挑选网站的链接,所以在提高了查准率的同时还可以在一定程
6、度上保证资源的质量。笫三,它可以根据用户的信息需求组织网站,可以追踪热点问题,关注网络用户最新的信息需求,体现网络分类法显著的“及吋性”。一些网站根据用户对站点的点击率来组织网站,还体现了用户第一的原则。但网络资源目录也有其不足:首先是,人工搜索和分类组织增加了建设成本、管理和维护成本,也存在漏检现象。其次,如果网络分类太细,用户要层层点击,使用不便,因此网络资源口录只能组织网络的部分资源。第三,网络资源目录的赢利导向,限制了网络资源的收录范围,影响了查全率和检索结果的学术性。如雅虎公司实行的网站收费服务,就使许多优秀的网站因
7、没有付费而不被网络资源目录所收录。1.3元搜索引擎无论是以关键词还是网络资源目录为检索入口的搜索引擎都无法查全网络信息资源。元搜索引擎是为解决查全率而产生的。元搜索引擎是一种利用现有的独立搜索引擎共同负责网络信息资源的查找,是一种多个搜索引擎的集成式查询工具。它可以在不降低系统效率的前提下,同时对搜索引擎进行并行或串行操作,并把多个搜索引擎的检索结果重新组织,按照相关性大小重新排序,以统一的界面呈现给用户。当最后一个返回的搜索引擎的结果产生时,才显示用户检索的结果,因此元搜索引擎在提高查全率的同吋降低了检索速度,并且仍然具有关
8、键词搜索引擎的缺点。1.4基于元搜索引擎的智能搜索引擎它是把智能代理技术应用到元搜索引擎中,通过增加专业词库、用户信息知识库來提高查准率。该智能代理按照用户的习惯,以用户提问的方式提出查询请求,产生精化了的个性化信息检索模式,用该检索模式启动信息检索模块调用元搜索引擎,去检索
此文档下载收益归作者所有