欢迎来到天天文库
浏览记录
ID:43206752
大小:2.16 MB
页数:71页
时间:2019-10-02
《信息服务与用户 第六章 信息检索》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第六章信息检索信息组织是指按照一定的规则来描述信息资源或信息对象,以便于能被需要它们的人高效地利用。信息检索则是指为了个人或他人的需要,去发现适当的信息资源或信息对象。信息组织和信息检索是一对互逆过程。6.1信息检索的沿革与发展6.1.1信息检索的涵义根据特定的需求,运用某种检索工具,按照一定的方法,从大量文献中查出所需的资料或信息的过程。满足信息用户的信息需求而建立的,存贮经过加工了的信息集合,拥有特定的存贮、检索与传送的技术装备,提供一定存贮与检索方法及检索服务功能的一种相对独立的服务实体(包括人
2、和检索工作单位),统称为信息检索系统(InformationRetrievalSystem,简称IRS)。信息检索系统的三个基本要素:人、检索工具(包括设备)和信息资料信息检索系统的体系结构潜在的相关信息信息组织和检索系统规范化的疑问式信息的组织概述的存贮比较/匹配索引(描述性的、受限制的)游戏规则=主题索引规则+辞典(包括词汇表和索引语言)需求概述或疑问式信息或数据检索流程组织流程存贮1:概述/搜索请求存贮2:信息的表示标引检索输出存储过程一次信息信息特征检索语言信息特征标识信息检索工具(系统)检索
3、结果检索过程检索课题检索提问检索提问标识分析分析标引输入6.1.2信息检索的类型与特性依检索结果内容划分依信息存储与检索方式划分手工检索计算机检索事实信息检索文献信息检索数据信息检索信息检索类型手工检索工具主要指,如印刷版的《全国报刊索引》。计算机检索系统主要指,如《中国期刊全文数据库》数据信息和事实信息检索是确定性的检索,检索结果可以直接利用。文献信息检索是一种相关性检索,检索结果是文献信息的线索,一般通过二次信息来实现。全文数据库:是一次信息和二次信息的综合体。在检索结果中,有直接的全文链接
4、。特性:信息检索的相关性相关性表明用户是否认为一文献与一提问吻合。信息检索的不确定性标引的不确定性是指不同标引员在给同一篇信息对象进行标引时会选用不同的标引词,即标引词选用的不一致性。信息检索的逻辑性6.1.3信息检索的发展历程三个阶段手工信息检索阶段机械信息检索阶段计算机信息检索阶段手工信息检索阶段信息检索起源于参考咨询工作,参考咨询工作产生的标志是1876年召开的美国图书馆协会第一届大会。1883年,波士顿公共图书馆首次设置了专职参考馆员和参考阅览室;20世纪初,多数图书馆成立了参考咨询部门,主
5、要利用图书馆的书目工具来帮助读者查找图书、期刊或现成答案。逐渐发展到从多种文献源中查找、分析、评价和重新组织信息;“索引”突破了以前的狭隘范畴,成为独立的检索工具;40年代进一步包括回答事实性咨询,编制书目、文摘,进行专题文献检索,提供文献代译等。“信息检索”从此成为一项独立的用户服务工作,并逐渐从单纯的经验工作向专业化方向发展。机械信息检索两种基本类型机电信息检索系统光电信息检索系统机械信息检索并没有发展信息检索语言,只是采用单一的方法对固定的存贮形式进行检索,而且过分依赖于设备,检索复杂,成本较高
6、,检索效率和质量都不理想。机械信息检索阶段计算机信息检索系统三个阶段:1971年以前建立的信息检索系统,是传统的批处理检索方式。1971年以后,产生并发展的联机信息检索系统,如OCLC、Dialog在线数据库联机检索系统。20世纪90年代以来,产生并发展的网络信息检索阶段。信息检索技术两个发展方向:传统信息检索向全文文本、多媒体、多载体等新型信息检索的发展,在深度上提高管理和组织信息的能力;信息资源的网络化和分布化,面向互联网中海量的信息资源,在广度上提高管理和组织的能力。6.1.4信息检索的模型布尔
7、逻辑检索模型(BooleanRetrievalModel,简称BRM)概率检索模型(ProbabilityRetrievalModel,简称PRM)向量空间检索模型(VectorRetrievalModel,简称VRM)模糊检索模型(FuzzyRetrievalModel,简称FRM)是一种比较成熟、较为流行的检索技术,现代信息检索系统多采用这种技术。逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符。主要的运算符有逻辑“与”、“或”、“非”,分别用AND(*)、OR(+)、NOT(-)表示
8、布尔逻辑运算符执行的优先顺序为NOT、AND、OR在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。布尔逻辑运算符含义AAND(*)B表示文献中同时包含检索词A和检索词B的文献才是命中文献如:查找“胰岛素治疗糖尿病”的检索式为:insulin(胰岛素)ANDdiabetes(糖尿病)。AOR(+)B表示包含检索词A的文献或者包含检索词B的文献或者同时包含检索词A和B的文献为命中文献如:查找“商务”的检索式为:commerceORbusi
此文档下载收益归作者所有