网络信息检索工具的现状与发展趋势

网络信息检索工具的现状与发展趋势

ID:4293054

大小:30.50 KB

页数:8页

时间:2017-11-30

网络信息检索工具的现状与发展趋势_第1页
网络信息检索工具的现状与发展趋势_第2页
网络信息检索工具的现状与发展趋势_第3页
网络信息检索工具的现状与发展趋势_第4页
网络信息检索工具的现状与发展趋势_第5页
资源描述:

《网络信息检索工具的现状与发展趋势》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、网络信息检索工具的现状与发展趋势科技情报开发与经济SCI/TECHINFORMATIONDEVELOPMENT&ECONOMY2004年第14卷第5期文章编号:1005—6033(20o4)05—0001—02收稿日期:2004—02—16网络信息检索工具的现状与发展趋势李书宁摘要:分别对基于网页的网络信息检索工具,基于FTP文件的检索工具,基于网络检索工具的检索技术的现状和发展趋势进行了比较深入的分析与探讨.关键词:网络信息检索;搜索引擎;多媒体检索;元搜索引擎;FTP文件检索中图分类号:G354.2文献标识码:A199

2、0年以前,没有任何人能够检索互联网上的信息.应该说,所有的网络信息检索工具都是从1990年的AlanEmtage等人发明的Arehie开始的,虽然它当时只能实现简单意义上的兀'P文件检索.随着worldWideWeb的出现和发展,基于网页的信息检索工具出现并迅速发展起来.1995年基于网络信息检索工具本身的检索工具元搜索引擎由美国华盛顿大学的EricSelberg等人发明.伴随着网络技术的发展,网络信息检索工具也得到了长足的发展.笔者仅对这些检索工具的现状和发展趋势作一探讨.1基于网页的网络信息检索工具1.1现状网页是因特网的最主

3、要的组成部分,也是人们获取网络信息的最主要的来源.为便于人们在大量繁杂的网页中找寻自己需要的信息,这类检索工具得到快速发展.一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种.网页搜索引擎是通过"网络蜘蛛"等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具.网络目录则与搜索引擎完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人员谨慎地选择网站的首页,并将其放入相应的类目中.网络目录的信息量要比搜索引擎少

4、得多,再加上不同的网络目录分类标准有些混乱,不便于人们使用,虽然它的标引质量比较高,但其利用率要比搜索引擎低得多.由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的不足.其一,随着网页数量的迅猛增加,人工无法对其进行有效的分类,索引和利用.网络用户面对的是数量巨大的未组织信息,简单的关键词搜索,返回的信息数量之大,让用户无法承受.其二,信息有用性评价困难.一些站点在网页中大量重复某些关键字,使其容易被某些着名的搜索引擎选中,以此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息.其三,网络信息时刻变动,实

5、时搜索几乎不可能,就是刚刚浏览过的网页,也随时有更新,过期,删除的可能.1.2发展趋势网络信息检索工具的发展主要体现在进一步改进,完善检索工具和检索技术,以提高检索服务质量,改变网络信息检索不尽人意的地方.主要体现在以下几个方面:一是网络检索工具开发提供商之间的合作越来越紧密.过去一般网络检索工具提供商只依靠自己建立的数据库来提供检索服务,检索范围有限,而现在某些着名的搜索引擎购买了其他公司的数据库或者技术内核,有的与其他搜索引擎建立伙伴关系,以便用户使用.二是信息检索工具专业化及服务内容不断深化.一些检索工具已经不再盲目追求加大

6、收录和标引量,而更加注重突出专业特色.在lycos搜索引擎目录中,我们可以看到商业搜索引擎,IT搜索引擎,人才搜索引擎,金融搜索引擎,医学搜索引擎等专业化的网络信息检索工具纷纷出现,信息检索工具的专业化已经成为一种不可逆转的趋势.信息检索服务商将服务更加深化:C,oogle推出了网页引文查询服务,通过它可以查看自己所要查询的资料被其他网站引用的情况,从而使用户更好地把握网页信息的质量;2003年8月,第三代中文搜索引擎慧聪问世,它集"广泛的地域搜索","强大的行业搜索","完美的MP3,Flash搜索"等众多搜索功能于一体,还开发

7、了"针对内容的相关性查询"和"符合汉语特性的模糊查询",可以实现汉语拼音查询和同音词纠错.三是网络信息检索工具的智能化.首先是网络蜘蛛的智能化.针对网络信息的动态更替性,网络蜘蛛通过启发式学习采取最有效的搜索策略,选择最佳时机获取从Internet上自动收集,整理的信息.网络蜘蛛能在网络的任何地方工作,能尽可能地挖掘和获得信息.网络蜘蛛还有网页跟踪监测功能,如果网页出现更新,删除等情况要及时在数据库中更新.网络蜘蛛具有跨平台工作和处理多种混合文档结构的能力.其次是检索软件的智能化.现在主要有智能搜索引擎,智能浏览器,智能代理.这些

8、网络检索工具都非常重视开发实现基于自然语言形式的输入,检索者可以将自己的检索提问以及所习惯的短语,词组甚至句子等以自然语言的形式输入,智能化的检索软件将能够自动分析,而后形成检索策略进行检索.比如现在的百度搜索可以在输入关键词以后,不断提供一些相近

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。