信息检索的基本知识

信息检索的基本知识

ID:41530047

大小:1.92 MB

页数:75页

时间:2019-08-27

信息检索的基本知识_第1页
信息检索的基本知识_第2页
信息检索的基本知识_第3页
信息检索的基本知识_第4页
信息检索的基本知识_第5页
资源描述:

《信息检索的基本知识》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章信息检索的基本知识主要内容1.信息检索概述2.信息检索原理及检索语言3.信息检索系统与检索工具4.信息检索的一般程序2.1信息检索概述2.1.1信息检索的含义信息检索(InformationRetrieval)是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,又叫信息储存与检索(InformationstorageandRetrieval),这是广义的信息检索,如图2-1所示。狭义的信息检索则是仅指该过程的后半部分,即从信息集合中找出所需信息的过程。信息存储与检索过程检索

2、工具数据库检索提问式分析分析标识标识匹配输出文献的选择与收集文献源用户文献特征标识语言信息需求检索提问检索结果反馈从这个图中,我们可以看出两条主线。一条主线是文献检索,通过分析自身的文献需求,提出检索请求。另一条主线是数据库的建设,通过获取文献源,对文献进行分类标引入库,建成可检索的数据库。当检索请求与数据库相匹配后,就返回检索结果,得到需要的文献。以《中文科技期刊数据库》为例它把我国公开或非公开发行的9000多种期刊,从1989年到现在的每一本每一期买回来,通过扫描、数码拍相等方式录入,转化为数字形

3、态,并对其中的每一篇文献进行分类标引和主题词标引等加工,然后入库,最后通过一个检索程序把它整合起来,发布在网络上,供人们检索使用。这个过程描述起来非常简单,但在做的过程中,有很多细节性的问题。比如,购买期刊,涉及到版权问题;文献标引,涉及到学术上的元数据标准问题;检索程序,涉及到IT技术;网络应用,也正在走向丰富的知识服务时代。2.1.2信息检索的类型1.根据检索对象划分根据检索对象的不同,早期的信息检索分为以下几种。(1)文献检索:以文献为检索对象。凡是查找某一课题、某一著者、某一地域、某一机构、某

4、一事物的有关文献的出处和收藏单位等,均属于文献检索。这是一种相关性检索,它提供的是与用户信息需求的相关文献的线索或原文。(2)事实检索:以特定的事实为检索对象如查找某一事物发生的时间、地点与过程,某类产品哪些厂家生产、哪个牌号最好等,均属事实检索。属确定性检索。(3)数据检索:以数据为对象的检索。如查找某一数学公式、数据、图表,某一种材料的成分、性能都属于数据检索的范畴。属确定性检索文献检索是一种不确定性检索,多利用专业检索工具,包括目录、题录、文摘、索引与搜索引擎及其相对应的数据库资源与网络资源。数

5、据检索与事实检索得到的是字、词、事物的概念、人名、机构名、地名、公式、参数、规格、型号等,所得结果非常准确,因而是一种确定性检索。数据检索与事实检索主要使用数据、事实型工具检索,包括词典、百科全书、手册、名录、年签、指南等类型及其相对应的数据库资源与网络资源。2.按检索方式分按检索方式分为手工检索(手检)和计算机检索(机检)两种方式。(1)手工检索:即用人工来直接查找所需信息的方式,多利用各种检索工具的印刷版来实现,如印刷型的目录、题录、文摘、索引等。手检直观,不需要辅助没备,但速度慢,漏检严重,查全

6、率受信息资源储备数量的限制。(2)计算机检索:就是将大量的文献资料或数据进行加工整理,按一定格式存储在机读载体上,建成机读数据库,利用计算机对数据库进行检索的信息检索方式。与手工检索相比,计算机检索速度快、效率高、查全率高,不受时空限制,检索结果输出方式多样等。但查准率与网络及数据库质量的高低直接相关。2.2.1信息检索原理各种检索系统的检索原理基本相同,简单地讲就是对信息集合与需求集合的匹配与选择。信息检索的基本原理如图2-2所示。2.2信息检索原理及检索语言检索提问标识与存储在检索工具中的文献索引

7、标识进行比较,两者一致或文献索引标识包含着检索提问标识,则具有该标识的信息就从检索工具中输入,输出的信息就是检索找到的信息。信息集合特征化表示特征化表示需求集合图2-2信息检索的基本原理示意图选择与匹配2.2.2检索语言检索语言又称标引语言、索引语言等,是信息检索系统存储和检索信息时共同使用的一种共同语言。即在文献存储时,文献的内容特征(分类、主题)和外表特征(书名、著者)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达,这种在文献存储和检索过程中,共同使用、共同遵循的语言就是检索语言

8、。传统的手工检索或现代的各种信息检索系统,都是通过一定的检索语言组织。通过检索语言,可以把能够表示文献特征的全部标识按一定的规则组成一个有序的检索系统,使每种文献在检索系统中都有固定的位置,从而为文献检索提供可能。检索语言的种类很多,按描述文献特征不同,检索语言可分为描述文献外表特征和内容特征的检索语言,如图2-3所示。检索语言外表特征内容特征题名(书名、篇名)著者代码(专利号、报告号、标准号等)引文(被引著者姓名和引用文献的出处)分类语言主题语言标题词

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。