搜索引擎的现状分析

搜索引擎的现状分析

ID:44422616

大小:68.50 KB

页数:8页

时间:2019-10-22

搜索引擎的现状分析_第1页
搜索引擎的现状分析_第2页
搜索引擎的现状分析_第3页
搜索引擎的现状分析_第4页
搜索引擎的现状分析_第5页
资源描述:

《搜索引擎的现状分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、扌商要:联网世界的到来,搜索引擎也变得越来越被人熟知和运用。以前,由于环境和人类发展的落后,人们所能获取到的信息很有限,因此人类能通过很简单的方式就能顺利得到有用的资源,但畏现在,科技的发达,环境的变换,人们所需要的信息的数量和总量是数之不尽的,单凭人类徒手,对于获取所需要的信息的能力还是很弱的。于是搜索引擎就是实现这个愿望的手段,就是人们畅游在无穷无尽的网络资源海洋的导航、指明灯。关键字:搜素引擎、互联网、信息第一章搜索引擎的产生搜索引擎的概念在丰富的网络数据库中,搜索引擎(searchengine)就是指根据

2、一定的方案、运用特定的计算机程序收集互联网上的信息,在组织和安排信息之后,提供给用户搜索服务的系统。从用户的层面看,搜索引擎给用户一个含有搜索框的页面,然后让用户在搜索框内键入一个关键词,经过浏览器传递给搜索引擎后,搜索引擎把用户输入的信息返冋,互联网络发展初期,以雅虎为代表的网站分类目录查找被世人熟知。网站由人工分类整理,挑选互联网上的精良站点,并简洁描述,分成不同的目录,用户查询时,通过一层层的点击来找寻自己想看的网站。这也是根据所谓的搜索引擎的搜索冃录服务的站点,但从严格来说,这不是一个搜索引擎。1.2搜索

3、引擎的组成通常来说,搜索器,索引器,检索器和用户接口这四个部分构成了一个搜索引擎。1)搜索器:搜索器的功能是在互联网中遨游,查找和收集信息,它通常是一个运行全天候的计算机程序,它希望尽可能地来搜索所有类型的新信息,同时由于在互联网上的信息更新迅速,所以为了防止无用的链接,必须在一定时间内就更新以前搜集的信息2)索引器:索引器的功能是理解搜索器所搜索的信息,从中抽取表示文件的索引项和生成一个文件库索引表,索引表可以采用索引算法,当数据量很大时,为了能够跟上信息量猛烈增长的速度,必须实现即时索引,索引算法对索引器的性

4、能有很大的影响,一个搜索引擎是否能让用户满意很大部分决定于索引的质量程度。3)检索器:检索器的功能是以用户的查找来快速的在索引库中检测出文档,对文档与查照评价,以及对马上输出的信息整理,并对用户实现反馈。4)用户接口:用户接口的效果有很多,首要目的是能让用户更方便有效地利用搜索引擎查找到自己想要的信息,用户接口的设计和实现使用人机交互的理论和方法,以便于充分适应人类的思维习惯。1.3搜索引擎的发展历史1990年,那是还没有出现WWCWorldWideWeb,万维网),所以FTPCFileTransportatio

5、nProtocol,文件传输协议)软件变成了共享文件的主要工具。要共享文件,就必须建立一个FTP服务器。用户必须使用FTP客户端而要检索FTP数据的人就,这样就导致数据不完整地散布在各个地方,最早的搜索引擎一Archie—就应运而生,它是由Montreal的McGillUniversity的学生AlanEmtage>PeterDeutsch^Bi11Wheelan发明的。人们只有使用Archie输入准确的文件名进行搜索,用户才会知道哪一个FTP地址可以用来下载该文件。随后,第一个互联网爬虫一MathewGray所

6、开发的WorldWideWebWanderer—岀现了,爬虫(Spider)是用来获取互联网信息的程序。1993年2月,六个斯坦福的学生创建了Excite,Excite0Architext项目衍生而来。他们觉得用静态的统计方法来分析词之间的关系以使搜索更有效。1993年10月,MartijinKoster创建了ALIWEB,AIJWEB不用经过网络来“爬”数据,也不需要很多宽带,这就彖征着ALIWEB许可用户提交他们自己的网页简介信息。1993年12月,三个比较完善的反馈式搜索引擎出现了,就是JumpStatio

7、n,WorldWide和RBSEoJumpStation与WorldwideWebWorm相似,基本都是收集页面的标题和头部信息,之后采用简单的线性寻找来进行检索。但是随着%b规模的迅速增长,JumpStation由于太慢而终止了。但是RBSE是最早可以索引Html文件正文的搜索引擎。1994年4月,YahooHJ现了,它是被DavidFili与JerryYang创办的。Yahoo分门别类地收集了一些站点供人们查询,这些站点都是手工收录的。WebCrawler在1994年4月20日被华盛顿大学的BrianPink

8、ertionWcbCrawler创建了,它是最先可以获取整个网页全文的爬虫程序。没过多久,它就变得非常的流行。1997年,Excite购买了它,并且A0为了L增强自己的NetFind而开始使用Excite来®WebCrawler为随后一年出现的Lycos,Infoseek和OpenText打下了基础。Lycos的问世是搜索引擎史上主要的一步,它由CarnegieMello

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。