第四章信息检索技术

第四章信息检索技术

ID:44988106

大小:183.00 KB

页数:30页

时间:2019-11-06

第四章信息检索技术_第1页
第四章信息检索技术_第2页
第四章信息检索技术_第3页
第四章信息检索技术_第4页
第四章信息检索技术_第5页
资源描述:

《第四章信息检索技术》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、图书馆信息化建设杨思洛图书馆信息化建设第一编图书馆信息化基础第二编图书馆自动化系统第三编数字图书馆理论与相关技术第一编图书馆信息化基础第一章图书馆信息化建设概述第二章图书馆信息资源规划与建设第三章信息系统的分析与设计第四章信息检索技术第五章图书馆与互联网第六章图书馆信息化建设的硬件环境第四章信息检索技术第一节计算机检索系统原理和构成第二节信息组织与存贮技术第三节信息检索技术第四节文档检索技术第五节Internet信息检索工具第一节 计算机检索系统原理和构成一、计算机检索的基本原理计算机检索是指利用计算机存储和检索信息。具体地说,就是指人们在计算机或计算机检索网络的终端机上,

2、使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,继而再由终端设备显示或打印的过程。计算机信息检索广义上讲包括信息的存储和检索两个方面。第一节 计算机检索系统原理和构成二、计算机信息检索系统的组成(一)计算机硬件、软件(二)通信网络(三)检索终端设备(四)数据库第二节信息组织与存贮技术一、数据库定义和类型1、数据库的定义将信息标引、著录后形成的信息记录,按一定格式依次录入计算机,并存储在磁带或磁盘上,形成供计算机检索用的数据库。数据库是被收集在一起的一组有序的信息单元,每个信息单元由若干个独立的结构单元组成,数据元存储在字段中,每个数据元描述

3、信息单元的一个特性。第二节信息组织与存贮技术2、数据库的类型按数据库所含信息的内容可以划分为以下类型:(1)文献书目数据库(BibliographicDatabases)(2)信息指南数据库(DictionaryDatabases)(3)数值型数据库(NumericDatabases)(4)全文数据库(CompleteTextDatabases第二节信息组织与存贮技术二、数据库编排结构所谓数据库的编排结构,就是计算机检索系统中数据库的每条记录数据项的编排方式,有顺排文档和倒排文档两种。(1)顺排文档(2)倒排文档第三节信息检索技术1、布尔逻辑检索(1)逻辑“与”(2)逻辑“

4、或”(3)逻辑“非”第三节信息检索技术2、位置检索位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。第三节信息检索技术3、截词检索(1)后方截词(2)中间截词(3)前言截词4、字段限定检索字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法第四节文档检索技术当提问逻辑式列出并输入到计算机后,经计算机检索系统自动检验,确认无误时,才开始检索。实现检索的途径主要采用顺排文档与倒排文档检索。第四

5、节文档检索技术一、顺排文档检索技术顺排文档是指按文献的输入顺序依次存贮的文档。顺排文档检索就是按顺序对数据库中每条记录进行查找。第四节文档检索技术其检索过程如下:(1)将用户提问逻辑式输入计算机,建立用户提问档,系统将提问档转换为提问展开表。(2)对每一条文献记录编制检索标识表。(3)将提问展开表与检索标识表进行比较。(4)输出命中结果。顺排文档检索技术1、提问展开表的建立2、检索标识表3、提问展开表与检索标识表的比较方法4、顺排文档检索流程5、批量提问检索第四节文档检索技术二、倒排文档检索技术倒排文档是由检索词和与其对应的原文献地址组成的索引文档。对倒排文档检索时,首先从

6、倒排文档中检索出有关的文献号集合,进行逻辑运算,得出结果,然后根据结果文献号集合从主文档中读出命中文献的全部信息。倒排文档检索技术1.倒排文档的建立2、提问逻式的“逆波兰表示法”3、操作指令表的建立4、检索过程第五节Internet信息检索工具——搜索引擎一、搜索引擎的基本概念二、搜索引擎的种类三、搜索引擎的一般查询规则四、主要的搜索引擎选介一、搜索引擎的基本概念1、搜索引擎的定义搜索引擎是一种能够通过Internet接受用户的查询指令,并向用户提供符合其查询要求的信息资源网址的系统2、搜索引擎的工作原理搜索引擎包括信息搜集、信息处理和信息查询三部分:(1)信息搜集(2)信

7、息处理(3)信息查询二、搜索引擎的种类1、按工作语种区分(1)单语种搜索引擎。单语种搜索引擎是指搜索时只能用一种语言查询的搜索引擎。(2)多语种搜索引擎。多语种搜索引擎是指那些可以用多种语言查询的搜索引擎。二、搜索引擎的种类2、按内容组织方式区分(1)目录式搜索引擎(网站级)(2)全文搜索引擎(网页级)3、按搜索范围区分(1)独立搜索引擎(2)多元搜索引擎(集成搜索引擎)三、搜索引擎的一般查询规则利用搜索引擎既可以检索出Internet上的文献信息,还可以查找到公司和个人的信息;既可以通过输入单词、词组或短语进行检

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。