第3章 信息检索系统ppt课件.ppt

第3章 信息检索系统ppt课件.ppt

ID:59018521

大小:2.10 MB

页数:39页

时间:2020-09-26

第3章 信息检索系统ppt课件.ppt_第1页
第3章 信息检索系统ppt课件.ppt_第2页
第3章 信息检索系统ppt课件.ppt_第3页
第3章 信息检索系统ppt课件.ppt_第4页
第3章 信息检索系统ppt课件.ppt_第5页
资源描述:

《第3章 信息检索系统ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第3章信息检索系统信息检索工具/系统信息检索系统基本结构信息组织各功能模块信息检索各功能模块知识组织工具7/28/2021华中师范大学信息管理系3.1信息检索工具/系统-二者关系从功能上看:检索工具和检索系统都用于信息的存储和检索,两者之间没有严格的、绝对的界限。从使用背景上看:检索工具是个比较传统的概念,而检索系统是个比较现代的概念从检索机制上看:两者是一脉相承的,检索工具的编制原理和方法在检索系统中都有体现,检索工具是检索系统的基础,至今仍然在发挥其重要作用。检索系统是检索工具发展的必然结果,并逐渐占据主导地位很多教材将检索

2、工具作为检索系统的一种特例本课程将检索工具定位为传统的手工印刷型检索工具,信息检索系统则定位于机器或计算机检索系统7/28/2021华中师范大学信息管理系3.1信息检索工具/系统-类型信息检索工具/系统种类繁多,可以从功能、设备等划分按照信息存储与检索操作所使用的设备分:手工检索工具(包括书本式与卡片式)、穿孔卡片系统、缩微式检索系统、计算机检索系统7/28/2021华中师范大学信息管理系3.1信息检索工具/系统-印刷型检索工具文献检索工具:目录(如全国书目)、题录(如全国报刊索引)、索引(如SCI)、文摘(如CA),它们主要用

3、来对某一课题相关文献进行查找,其结果大多是获得一批文献的线索,少有全文,它们是题录型机读数据库的基础数值/事实检索工具:如百科全书、传记资料、年鉴、地理资料、统计资料、手册等7/28/2021华中师范大学信息管理系3.1信息检索工具/系统- 检索工具体系结构编辑说明与使用说明、凡例目次表(多为分类表或主题表)正文(有序的信息集合)辅助索引(如主题索引、著者索引等)附表(资料来源目录与附录等)7/28/2021华中师范大学信息管理系3.1信息检索工具/系统-计算机检索系统单机检索系统:如穿孔卡片系统以及磁带数据库系统,20世纪60

4、年代使用联机检索系统:20世纪70年代发展起来的一种集中式的信息检索光盘检索系统:以光盘为介质的检索系统,有单机光盘和网络(局域网)光盘检索网络检索系统:主要指Internet网络,大量的电子化信息资源,如电子图书、电子期刊、图书馆联机馆藏目录、联机数据库等。7/28/2021华中师范大学信息管理系3.2信息检索系统基本结构-简介系统结构:指系统的组成及各组成部件之间的关系系统的结构可以从不同的角度和层次来讨论本课程主要从物理层面和逻辑层面来考察其内部构成7/28/2021华中师范大学信息管理系3.2信息检索系统基本结构-物理结

5、构计算机检索系统的物理结构指系统的硬件、软件、信息资源等构成的实体系统结构硬件部分:主机、外存储器、输入与输出设备、数据处理及数据传输设备软件部分:系统软件(操作系统、语言处理程序等)和应用软件(数据采集程序、自动标引程序、建库与索引程序、词汇管理程序、检索匹配程序等)信息资源:主要指以数据库(还有模型库、规则库、本体库等)形式存储在检索系统的有序信息集合同时按照物理空间的分布情况,信息检索系统的物理结构还可以分为集中式和分布式7/28/2021华中师范大学信息管理系3.2信息检索系统基本结构-逻辑结构检索系统的逻辑结构主要指它

6、所包括的功能模块及其相互关系基本逻辑结构图7/28/2021华中师范大学信息管理系3.3信息组织各功能模块-信息资源及其采集在创建信息系统之前,需要先根据检索系统经营方针和服务对象的需要从各种信息源和信息渠道中完成信息资源的采集工作它决定了信息检索系统中数据库的类型及收录范围目前的信息检索系统多采用计算机为主导的资源采集方法,如扫描、复制、链接、合并以及格式转换都有计算机完成7/28/2021华中师范大学信息管理系3.3信息组织各功能模块-标引处理对之前采集的信息进行各种检索特征的分析并使之显性化的过程,其实就是信息组织过程中描

7、述著录以及揭示标引的工作标引工作决定数据库的标引深度和检索点标引前一般要先对文献进行词汇分析,对其中的数字、连字符、标点符号和字母的大小写进行处理自动标引分为自动抽词和自动赋词7/28/2021华中师范大学信息管理系3.3信息组织各功能模块-自动标引思路分析自动抽词标引思路标引词往往会选择高频词,考虑词的绝对数、与文本长度有关的数、词频超过一定阈值的词数、或根据算法计算出的重要短语。在西文文献中,抽词标引时还可以选择标引词根。如单复数、动词状态等自动赋词标引思路预先编制词表,如叙词表需要有将被引文献中的词和词表中词进行匹配计算的

8、算法有概率模型和基于概念的模型7/28/2021华中师范大学信息管理系3.3信息组织各功能模块-基于词汇分布特征的标引统计标引法:词频统计标引法:齐夫定律加权统计标引法:逆文档频率法:词的文献频率和词权有互逆关系.词区分值法:本质和逆文档频率法一致,但采用向量模

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。