网上搜索的方法和技巧

网上搜索的方法和技巧

ID:1257843

大小:48.00 KB

页数:5页

时间:2017-11-09

网上搜索的方法和技巧_第1页
网上搜索的方法和技巧_第2页
网上搜索的方法和技巧_第3页
网上搜索的方法和技巧_第4页
网上搜索的方法和技巧_第5页
资源描述:

《网上搜索的方法和技巧》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、网上搜索的方法和技巧我们已经知道网上有多种多样的教育资源,从技术上讲,它们是在Internet的多种服务功能的支持下实现的,包含WWW、e-mail、Usenet、FTP、BBS等,其中发展最快,也是最为流行的是WWW。因此我们着重介绍WWW信息的检索方法。据1999年底的统计,网上大约有15亿个网页,并且以每天增加190万个网页的速度在增长,到2002年已达到80亿个网页。要想在这么大的一个资源库中查找一条具体的信息,犹如大海捞针一般。因此,有人发出这样的感叹:"我们淹没在数据资料的的海洋中,却又在忍受着知识的饥渴"。现在出现了许多种在网上查找信息的方法。这些方法可以分为两类:一

2、类是有既定目标的查找,一类是没有目标的查找,而后者往往是指一种网上"冲浪"游戏。在具有既定目标的情况下,如果已有信息线索,可以用浏览器航行的办法寻找信息对象;如果信息线索未定,则需要利用搜索工具首先获得信息线索。搜索工具又有传统工具和现代工具之分。传统工具是在索引数据库中进行主题树/目录检索或KWDSEs(关键词搜索引擎)进行建设而索引库的建设是一个极其繁重的任务,现在已经可以利用"机器人"程序来帮忙,它们通过跟踪最新建立的HTML网页的URL对整个网络进行浏览,可以在网上从这一个网站爬到另一个网站,并记录下它们访问过的网页的各自特征(这种只有十来年历史的搜索技术就被称为传统工具了

3、,你觉得奇怪吗?)。而现代搜索工具是利用智能代理来工作,它们不是对整个网络进行索引,而是在接到一个新任务时就出发,去搜索网上资源并提取有价值的信息。因此,智能代理是利用神经网络技术进行搜索,它试图去发现自然语言与样本网页的模式及它们之间的相互关系,这些将与新近发现的网上资源相匹配,最后以一串网址的形式供用户访问。图2_3_10显示了网上信息检索工具的选择方法。(一)搜索工具在Internet上现有的检索工具成百上千,比较普及且功能较强的就有几十种。这些检索按照其工作原理的不同,大概可以分为3种类型:1.主题目录主题目录有时也称为主题指南,什么是主题目录呢?让我们打开雅虎中国网站ht

4、tp://gbchinese.com.cn来看一看。在网页首页的中部正是雅虎自定义的一级主题目录,其中一个类目就是"教育"。如果我们点击"教育"将会看见其下一级类目,如果接着点击其中一个子类目,还可以进入更下一级类目,直到某一个具体网站或网页。主题目录是按照等级排列的主题类索引,排列的方法有字母顺序法、时间顺序法、地点法、主题法等等,或是各种方法综合使用。主题目录能让用户通过主题浏览Web站点列表检索相关信息。主题目录主要是依靠图书馆和信息专业专家对已知的网站根据其主要内容进行筛选、组织和评论,从而编制的等级式的主题目录。有时也允许网站拥有者对他们自己的网站加以归类或进行类别描述;

5、有的网站则干脆邀请随机的网站访问者来对网址进行分类。这些主题目录以超文本链接的方式将不同学科、专业、行业和区域的信息按照分类目录的方式组织起来,类目之间按照等级系统排列,然后将待收录的网页与相应的类目或主题相连。这样,用户就可以通过主题目录的指引,在相应的等级结构中逐层浏览,直到找到与自己的需求相关的信息。目前以主题目录为核心,并且收录网络信息较多的网站有雅虎中国l(http://www.yahoo.cn.com)、图书馆员索引(http://www.lii.org)、信息开采(http://infomine.ucr.edu)等。由于主题目录要由人工编制和维护,在信息的收集、编排、

6、HTML编码以及信息注释等方面要花费大量的人力和时间。人工干预虽然减少了主题目录下不切题结果的可能性,但也往往会造成某一主题下的站点不够多、不够全面的缺陷。同时由于Internet上网页数最庞大并且在不断变化,所有的主题类别都要能跟上站点内容的发展,也很难办到,所以碰上部分站点为"死链"或已经过期也就不奇怪了。总体而言,主题目录特别适宜于一般性的、比较笼统的主题的浏览和检索。其等级式分类令用户可以自由选择检索范围,并且从大到小的范围逐级浏览也十分方便。但是使用主题目录很难检索到较为专业的信息,且由于人类的分析判断带有主观性,网址分析归纳者的网站分类方法也不一定与用户的需要相适应。如

7、果思路碰巧与网址分析归纳者的思路合拍的话,这些主题目录可能会对用户有巨大的价值;但假如情况相反,用户则会感到它们牵强而且不可捉摸,精心分析和归纳的数据与实际需求风马牛不相及。在许多时候,用户需要的信息会分散在好几个不同的主题类别下,用户容易错过交叉有关的信息。另外,不同的网站提供的主题目录的分类和结构不尽相同,用户有时要找到合适的类别也有相当的难度。2.搜索引擎搜索引擎的基本概念出现于20世纪20年代,但真正发展和应用却是20世纪90年代的事情,特别是在90年代中期得

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。