web 搜索引擎综述

web 搜索引擎综述

ID:34563296

大小:69.03 KB

页数:7页

时间:2019-03-08

web 搜索引擎综述_第1页
web 搜索引擎综述_第2页
web 搜索引擎综述_第3页
web 搜索引擎综述_第4页
web 搜索引擎综述_第5页
资源描述:

《web 搜索引擎综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、张卫丰,徐宝文,周晓宇,李东,许蕾.Web搜索引擎综述.计算机科学,2001,28(9),24-28*Web搜索引擎综述张卫丰徐宝文周晓宇许蕾李东(东南大学计算机科学与工程系南京210096)摘要随着网络信息量的爆炸式增长,人们查找信息越来越难。Web搜索引擎的出现在一定程度上解决了这种矛盾。本文讲述了搜索引擎的历史、搜索引擎的现状;分析了搜索引擎的相关指标并给出了对应的检测方法;在此基础上阐述了搜索引擎的发展趋势。关键词互联网,WWW,搜索引擎,分析方法OverviewoftheWebSearchEngineZhangWei-fengXuBao-wenZho

2、uXiao-yuXuLeiLiDong(DepartmentofComputerScienceandEngineering,SoutheastUniversity,Nanjing210096)AbstractWiththeexplosiveincreaseofthenetworkinformation,peoplecanfindinformationmoreandmoredifficultly.Theoccurrenceofthewebsearchengineovercomesthisprobleminsomedegree.Thispapertellsofth

3、ehistoryofthesearchengine,thecurrentstateofthesearchengine.Someguidelinesaboutthesearchengineareanalysedandtherelatedcheckingmethodsarealsogiven.Inthisbasis,weintroducethetrendofthesearchengine.KeywordsInternet,WWW,searchengine,analysismethod1引言互联网络的历史只能从1960年代后期算起。从早期的阿帕网(ARPANet),

4、到目前的因特网,互联网飞速发展,基于互联网的各种应用也应运而生。互联网上的信息也也越来越多,因此迫切要求一种信息检索工具。1991年,XWAIS提供了一个界面友好的信息搜索系统,但是这个系统要求很特殊的文件格式。在同一年出现了另外一个信息检索系统GOPHER,GOPHER一时成为最为流行的检索工具。由于GOPHER基于字符界面,一般的互联网用户还是很少使用它。真正让互联网普及的转机出现在1993年。当年美国国家计算机安全协会NCSA推出第一个基于HTML语言的可以浏览图形的浏览器Mosaic。它使得普通的用户可以轻松地使用互联网。1994年,美国网景公司推出免

5、费浏览器Netscape。这使得以HTML为格式的信息迅速膨胀。是年,Yahoo公司创立,它提供基于目录的信息检索服务。而真正意义上的搜索引擎创建于1994年春天的Lycos,当时MichaelMauldin将JohnLeavitt的“网络蜘蛛”(spider)程序接入到其索引程序中。在随后的几年里,互联网和web技术的进一步发展,网上的信息越来越多,据1999年的估计,到1999年底,至少有1600万台主机联入因特网,网上的网页数量已经达到10亿,而且正在以每月近千万的数量增长,甚至有人预言Web页面的数量每隔100到120天要翻一翻。国内外的调查结果都表明

6、,当前互联网上仅次于收发电子邮件的第二大应用就是在网上搜索信息,而这种搜索绝大多数都是通过专门的、高度复杂的搜索引擎实现的。搜索引擎一词在国内外因特网领域被广泛使用,然而,它的含义却不尽相同。在美国,搜索引擎通常指的是基于因特网的搜索引擎,它们收集因特网上几千万到几亿个网页,并且每一个网页上的每一个词都被搜索引擎所收录,也就是我们所说的全文检索。典型的因特网搜索引擎包括FirstSearch、Google、HotBot、Infoseek、Northernlight等。在中国,搜索引擎通常指的是基于网站目录的搜索服务或是特定网站的搜索服务。前者如搜狐、新浪等公司

7、开*本研究得到国家自然科学基金(60073012)与教育部高等学校骨干教师资助计划资助。1张卫丰,徐宝文,周晓宇,李东,许蕾.Web搜索引擎综述.计算机科学,2001,28(9),24-28发的网站搜索服务,后者如Chianren(search.chinaren.com)网站上提供的全文检索服务。在下文中所指的搜索引擎均为基于因特网的搜索引擎。现在大多数的搜索引擎以搜索文字信息为主。随着网络带宽的不断加大,多媒体信息在网上迅速增加。这就对多媒体信息的检索提出了要求。多媒体信息检索主要是指基于音频的检索、基于图片的静态图象检索和基于视频的动态图象检索。现在研究得

8、较多的是图象检索。由于在搜索过程中很难

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。