《信息检索理论基础》PPT课件

《信息检索理论基础》PPT课件

ID:45182267

大小:508.00 KB

页数:47页

时间:2019-11-10

《信息检索理论基础》PPT课件_第1页
《信息检索理论基础》PPT课件_第2页
《信息检索理论基础》PPT课件_第3页
《信息检索理论基础》PPT课件_第4页
《信息检索理论基础》PPT课件_第5页
资源描述:

《《信息检索理论基础》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章 信息检索理论基础第一节信息存储与检索基本原理一、基本概念信息存储与检索概念的起源信息存储与检索的含义信息检索概念的起源信息检索(Informationretrieval)起源于原文献检索、情报检索,在1998年设置的专业目录中得以改变。不同的称谓产生于不同的历史背景。在20世纪中叶以前,信息存储传播主要以纸质为载体,信息检索活动也围绕文献的获取和控制展开。因此,信息检索研究关注的是如何检索利用文献中记录的信息,从而导致文献检索成为信息检索的同义词,早期的研究文献中几乎不使用“信息检索”这一概念。20世纪50年代以后,社会信息传播与存储载体呈现多元化,人们不再拘泥于载体研究信息

2、检索,于是开始使用情报检索一词。由于汉语中“信息”一词较“情报”一词含义更为宽泛,加之英语词汇“Information”具有“情报”、“信息”的含义,因此,近年来人们越来越倾向于将文献检索、情报检索转变为信息检索这一更具兼容性的概念,以便对信息检索实践起到更全面的指导作用。目前的现状是,上述几个概念同时使用,因为它们的目的是获取信息。由信息检索改为信息存储与检索是为了更好地明确信息存储与信息检索的关系,从而更有效地进行信息的获取。信息存储与检索的含义信息存储是指依一定的要求把信息整序编排成文献集合体的过程,即编制检索工具和建设数据库、建立检索系统的过程,也即广义的信息检索。广义的信息

3、检索包括信息存储与信息检索两个环节。狭义的信息检索是指利用编制好的检索工具和检索系统来查找所需信息的过程。目前广义的信息检索和狭义的信息检索概念被同时使用着。第一节信息存储与检索基本原理二、基本原理信息存储基本原理信息检索基本原理信息存储基本原理书本式文献的传统存储方法是图书馆纸质文献管理法和印刷型检索工具的编制,包括图书、期刊、专利、科技报告、政府出版物、技术标准、会议论文、学位论文、产品样本、档案十大信息源的分类存储,由这套系统决定的手工检索体系使文献分类等描述文献内容的特征处于核心地位,文献篇名、作者名等描述文献外表特征则是天然的补充要素,加上主题,构成手检时按分类、主题、号码

4、、作者名检索的四大途径。机读信息则以数据库(Database)形式存储。信息被分类、编码、标识且以数据形式存入数据库后,计算机就能按电子数据方式进行处理并检索。信息检索基本原理信息检索的基本原理就是,为了文献信息的充分交流和有效利用,让信息用户能在文献信息的“海洋”中准确、全面、及时地获取满足特定需要的信息,通过对广泛、大量、分散、无序的文献信息进行搜集、加工、组织、存储,建成各种各样的检索系统,在统一存储过程和检索过程所用检索语言和名称规范的基础上,将用户表达检索课题的标识与检索系统中表达文献信息内容和形式特征的标识进行相符性比较(匹配),凡是双方标识一致(完全一致或部分一致)的,

5、就将具有这些标识的文献信息按要求从检索系统中输出。检索系统输出的文献信息既可能是用户需要的最终信息,也可能是用户需要的中介信息(比如文献线索),用户依此中介信息的指引,可进一步获取需要的最终文献和信息。输出标引著录检索过程文献信息检索课题文献信息标识(标引词)检索提问标识(检索词)文献信息特征检索提问特征检索语言和名称规范检索系统(标识匹配)检索结果分析分析选用形成形成检索提问特征检索语言和名称规范第一节信息存储与检索基本原理三、相关概念检索系统检索系统的评价检索工具检索系统检索系统是指拥有特定的存储和检索技术设备,存储有经过加工的信息资源,供用户检索所需信息的工作系统。检索工具广义

6、检索工具是指用以报道、存储、查询文献信息的一切工具和设备。它以各类型原始文献为素材,在广泛收集并进行严格筛选后,通过特定的信息工作方法,分析和提示文献的外形特征和内容特征,用选定检索语言进行描述和标引,形成文献信息单元款目,再将这些款目按特定规则组织编排而成。它是一个综合的概念,可以分为手工检索工具、计算机检索工具。从此可以看出,广义检索工具和检索系统的含义是一致的。狭义检索工具主要指手工检索工具,又称印刷型检索工具或书本式检索工具,即印刷装订成册的纸质检索工具及相应的设施。检索系统的评价检索系统的质量影响着检索系统的使用效果,根据检索课题选择检索系统时需要考虑检索系统的质量。一般地

7、说,可以从下述几个角度对检索系统进行评价。1.检索效率检索效率是指检索过程和检索结果具有便、快、全、准、省等特点,即用检索方便性、检索速度、查全率、查准率、检索成本与效益等指标来衡量。2.收录全面性检索系统的全面性是指它收录的文献信息是否全面。一般用三个指标来衡量。覆盖面:指检索系统收录范围所覆盖的学科面和出版物类型及数量。摘储率:是指检索系统收录的文献信息数量与其覆盖面内全部文献信息数量的比率。报导数:是指一定时间内报导文献信息的数量,如文摘或题录的条数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。