internet的查询工具使用论文

internet的查询工具使用论文

ID:10028675

大小:31.50 KB

页数:9页

时间:2018-05-21

internet的查询工具使用论文 _第1页
internet的查询工具使用论文 _第2页
internet的查询工具使用论文 _第3页
internet的查询工具使用论文 _第4页
internet的查询工具使用论文 _第5页
资源描述:

《internet的查询工具使用论文 》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Internet的查询工具使用论文Internet的查询工具使用论文Internet的查询工具使用论文Internet的查询工具使用论文Internet的查询工具使用论文Internet的查询工具使用论文Internet的查询工具使用论文  Internet就像一个浩瀚的知识海洋,里面蕴藏着取之不尽的信息宝藏。如何挖掘开采它,获得人们需要的东西,目前还存在着两方面的问题:首先,人们手头的查询工具太多,有WWW(WorldWideWeb)、Gopher、FTP以及不计其数的专题新闻组、消息表等等;其次,Internet网上的资源没有确定的分类,人们

2、要查找的是一堆毫无组织、地址不唯一的信息。同时,那些热心的程序员、厂商、经纪人还在源源不断地往Internet上填充着他们的东西。这无形中给检索工作带来了很大难度,没有一定的方法,在Internet上查询信息犹如大海捞针。哪种情况  下该用什么样的工具帮你简便快捷地找到你想要的信息,看了本文以后,或许会对你有所帮助。  目录帮助  假如你要查找人们普遍感兴趣的题目,如内战或者热线财经一类的消息并找到其网络地址,通常这类目录会很大,而且有按专题组织的地址表。这种情况下,我们一般喜欢用Yahoo(地址:/)查找,它列出了8万个网络地址(包括Web页、

3、Gophers、FTP地址以及Usenet新闻组),顶层又按艺术、计算机、卫生、保健等分成14类子题目。用鼠标点一下就可以选定子题目表,反复地查找子表,直到你找到需要的信息为止。  除了Yahoo一类人们普遍感兴趣的目录外,专题目录则覆盖了从古文物到青年工人等各方面的信息。找到这些专用目录的最佳途径是可以去密执根大学(地址:http:///)查找那里的Clearinghouse,那里有面向专题的Internet资源指南。  查询引擎  当人们意欲查询Web提供的信息时,目录项是非常有用的,用户的问题越专有,待查的目录项就越少。为了取得问题的答案,

4、人们必须使用查询引擎。查询引擎实际上是一些Web页,你可以在其中输入你想要查找的文本串。按一下按钮,等一会儿,引擎就会识别出与输入的关键字匹配的Web地址表。在最近的Web查询扫描中,我们查到60个这样的页,其中只有10页是我们觉得有用的工具,其余的用处不大,或者只有计算机科学专业的研究生对之感兴趣。  每一个查询引擎代表一个数据库,里面含有Web页的URL(UniversalResourceLocator或经专门格式化后的Internet地址)地址以及其他网络资源。大多数查询引擎数据库是由Crawler程序、漫游Web的软件程序通过页与页的连接

5、顺次查找新的地址搜集而来的。这里,Crawler又被称为机器人或蜘蛛。当蜘蛛找到新的页时,就把新页增加到数据库中。  这些数据库存有成千上万个Web页,在引擎头的位置每天都在增加新的页。其中,多数人感兴趣的引擎如Lycos和Excite覆盖面最广,其中每个数据库有150万个索引Web页,其次是OpenTextIndex,据称也有130万个Web页。  每个数据库引擎的大小对查找是否成功起着很大的作用,例如,我们想用字符串recipewheatBeer(酿啤酒秘诀)查询每一个引擎,其结果是:最大的Lycos数据库引擎提供给我们437个匹配页(hit

6、),InfoSeek和OpenTextIndex数据库则每次提供200个页,用其他数据库则少于100页,有几种情况下,甚至查不到一个Web页。通常的情形是,数据库越小,查到的Web页就越少。  大多数数据库引擎严格限制其只能检索Web本身,InfoSeek和Excite则比其他引擎更进一步,它们增加了Usenet新闻组索引。InfoSeek还允许用户查询就近的一组非Internet数据库的信息。  索引中的信息  Web的蜘蛛程序比URL采集信息做得要多一些,它们还搜集有关每一页的信息,一旦你提交一个查询,查询引擎的backend软件就建立起一个

7、你所需信息的索引。从一个引擎到另外一个引擎,其索引技术是各不相同的,你不要因此感到奇怪。  在每个引擎中,都有一个页的索引URL地址和题目。多数引擎还有每一段的索引标题,其他的引擎则只是记录了频繁提到的词或者文本的头几行。在OpenTextIndex数据库引擎中,页的每一个单词都有索引,甚至包括and一类别的引擎忽略的词也有。结果可想而知,它理所当然成了唯一能在查找过程中返回是或者不是的查询工具。即使不包含你所指定的关键字,Excite基于概念的索引也能够帮助人们找到相关的页。  找到匹配页并不意味着查询成功。一方面,数据库的大小确定了它查到的匹

8、配页的多少,另一方面,索引质量的好坏还要由有多少个匹配页与你的查询相关来确定。如我们通过每一个查询引擎查找北卡罗来纳三角地的房地产信息,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。