05.网络信息检索

05.网络信息检索

ID:38312262

大小:5.08 MB

页数:70页

时间:2019-06-09

05.网络信息检索_第1页
05.网络信息检索_第2页
05.网络信息检索_第3页
05.网络信息检索_第4页
05.网络信息检索_第5页
资源描述:

《05.网络信息检索》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、5网络信息检索概况Internet网络上蕴藏着非常丰富的信息资源,从电子期刊、电子工具书、商业信息、新闻、大学和专业机构介绍、软件、数据库、图书馆资源、国际组织和政府出版物,到娱乐性信息等等。它已经成为全球范围内传播科研、教育、商业和社会信息的最主要的渠道。但要从这个信息海洋中准确迅速地找到并获得自己所需的信息,却往往比较困难。正是为了解决这个问题,从20世纪80年代起人们就开发了各种网络信息检索工具。检索工具万维网检索工具主要检索万维网站点上的资源,它们常被称为搜索引擎、主题网关等,而且由于万维

2、网资源常以网页的形式存在,它们的检索结果常常被称为网页。非万维网检索工具主要检索特殊类型的信息资源,如Archie一检索FTP文件;Veronica一搜索Gopher服务器;WAIS-全文信息检索工具;DejaNews-检索新闻组等。不过越来越多的万维网搜索引擎具备了检索非万维网资源的功能,使它们成为检索多类网络信息资源的集成化工具。5.1搜索引擎概念搜索引擎是一个为你提供信息检索服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。搜索引擎的组成1.搜索器2

3、.索引器3.用户检索界面运作过程1.发现并搜集网页信息(robot、spider)2.对信息进行提取并建立索引库3.用户检索利用搜索引擎的检索方式目录浏览、关键词检索搜索引擎的分类按索引方式分:关键词搜索引擎:Google、Altavista、Excite、hotbot、一搜(yisou)、百度(baidu)、中国搜索(zhongsou)等;目录式搜索引擎:Yahoo、DirectHit、Britannica、常青藤等;B.按检索内容分:综合性的搜索引擎:infoseek、excite、yahoo

4、等;专业搜索引擎:专门收录某一方面、某一行业、某一主题的信息,如全球华人寻人引擎(http://www.look4.com)提供因特网上最强大的寻人功能,拥有一百万笔的中文姓名和E-mail资料。LIBClient-IRISWeb(法律信息)、MapBlast(地图)、ImageRover(图像)、eefind(中文图像)、Webcate等。单词检索词组/短语检索(用双引号“”)c.布尔逻辑检索:and/or基本上均适用,逻辑非有的用not,有的用andnotd.嵌套检索:用括号来改变检索次序e.

5、字段检索:一般的搜索引擎给出的可检字段有:网页标题、域名、URL、链接;f.截词检索和通配符检索:目前大多数搜索引擎提供了前方一致的截词功能;g.大小写敏感检索:不同搜索引擎的限制不一样搜索引擎的检索特性常用搜索引擎介绍及示例Google》(中文)网址:http://www.google.com概述特点检索功能使用时应主意的问题《Google》概述Google是由美国斯坦福大学的两位博士生拉里·佩吉和谢尔盖·布林于1998年创建的其优势在于掌握的信息量以及检索模型和检索速度。它可为世界各地的用户提

6、供适需的搜索结果,而且搜索时间通常不到半秒Google采用全文标引方式,提供每日更新。现在,Google可以查询的网页达40多亿个,每天需要提供1.5亿次查询服务Google的查询界面设置搜索偏好,包括每个网页上默认的搜索结果数量、界面语言,以及查询语言直接进入最符合搜索条件的网页Google的其它版本《Google》特点支持多达132种语言提供40多亿个搜索网页,涵盖内容齐全搜索速度快结果命中率高搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介智能化的“手气不错”功能,提供可能最符合要求的

7、网页“网页快照”功能,能从Google服务器里直接取出缓存的网页《Google》检索功能基本检索:(布尔检索功能)逻辑“与”:检索框中的两个关键词之间用空格隔开则默认为是“AND”(“与”运算)连接逻辑“非”:用“—”(减号)表示,同时要求在减号前保留一个空格逻辑“或”:用“OR”表示双引号、连字号、斜线、问号、等号、省略号都可以作为短语的连接符号查找名言或专有名词指定网域:利用site:xxxx.com可以在某个特定的网站或域中进行搜索指定文件类型:filetype:文件类型,可以在一类文件中进

8、行搜索,比如,filetype:pdf,filetype:ppt等逻辑与功能逻辑非功能逻辑或功能专用语查询功能“”、“-”、“”、“+”、“=”、“,”“'”指定网域指定文件类型《Google》检索功能其它检索语法搜索的关键词包含在URL链接中:inurl:搜索的关键词包含在网页标题中:intitle:搜索的关键词包含在网页的“锚”中:inanchor:或allinanchor:搜索所有链接到某个URL的网页:link:《Google》检索功能高级检索功能可以排除某个特定站点的网

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。