信息检索概述(论文资料)

信息检索概述(论文资料)

ID:36834307

大小:405.97 KB

页数:33页

时间:2019-05-10

信息检索概述(论文资料)_第1页
信息检索概述(论文资料)_第2页
信息检索概述(论文资料)_第3页
信息检索概述(论文资料)_第4页
信息检索概述(论文资料)_第5页
资源描述:

《信息检索概述(论文资料)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第一章概述本章主要内容信息检索基本原理信息检索系统信息检索发展历史与趋势信息检索学科研究范围8/29/20212信息检索系统开发与设计第一章1.1信息检索基本原理InformationRetrieval信息检索将情报按一定的方式组织和存贮起来,并根据用户的需要找出有关情报的过程。(赖)一种延时性通讯形式,在时间上从一个时刻通往一个较晚的时刻,而空间上可能还在同一地点。(CalvinW,Mooers,1949)是对信息条目(InformationItems)进行表示、存贮、组织和存取(Access)的过程。Information

2、Access信息存取8/29/20213信息检索系统开发与设计第一章1.1信息检索基本原理信息检索的基本目标:检索出所有与用户提问相关的文献,同时尽可能检出更少的不相关文献。相关信息的有效检索涉及两个方面用户任务文献的逻辑表示8/29/20214信息检索系统开发与设计第一章1.1.1信息检索中用户任务检索浏览数据库图1-1信息检索中用户任务8/29/20215信息检索系统开发与设计第一章1.1.1信息检索中用户任务检索retrieval用户将其信息需求和问题翻译成检索系统要求的提问式(query),系统匹配后,提交相关文献。浏

3、览browsing使用交互式界面翻阅整个文献集合,以找出感兴趣的相关文献。8/29/20216信息检索系统开发与设计第一章1.1.1信息检索中用户任务传统检索系统:数据检索或信息检索超文本系统:快速浏览电子图书馆与Web搜索引擎系统:检索与浏览的结合。8/29/20217信息检索系统开发与设计第一章1.1.2文献的逻辑表示全文本——标引词的集合目的:降低文献表示的复杂性,和计算机处理的难度。8/29/20218信息检索系统开发与设计第一章图1-2文献的逻辑表示文本结构文献结构识别着重空格标点等处理停用词处理名词集合词根处理自动

4、或手工标引标引词结构全文本标引词8/29/20219信息检索系统开发与设计第一章1.1.2文献的逻辑表示传统:一个集合中的文献常常通过标引词或关键词的集合来表示。现代:用文献的所有词集合以及结构来表示成为可能,检索系统采用文献的全文本(full-textview)视图逻辑表示。8/29/202110信息检索系统开发与设计第一章1.2信息检索系统信息检索系统是由一定的设备和信息集合构成,面向一定的用户,具有信息采集、组织、存贮、选择和传播等功能的信息服务设施。8/29/202111信息检索系统开发与设计第一章1.2.1信息检索处

5、理过程定义和建立文本数据库用户提问操作匹配处理8/29/202112信息检索系统开发与设计第一章用户界面文本操作提问操作逻辑视图数据库管理者模块标引查询排序检索得文献用户反馈倒排文档索引排序文献文本数据库文本图1-3检索处理过程文本8/29/202113信息检索系统开发与设计第一章1.2.1信息检索处理过程文本数据库由数据库管理者模块建立确定使用的信息条目范围文本操作处理定义文本的逻辑视图,建立索引8/29/202114信息检索系统开发与设计第一章1.2.1信息检索处理过程8/29/202115信息检索系统开发与设计第一章1.

6、2.1信息检索处理过程8/29/202116信息检索系统开发与设计第一章1.2.2信息检索系统的逻辑构成信息检索系统的逻辑构成主要是指它所包括的功能模块或子系统及其相互关系。一个完整的信息检索系统,通常由以下几个功能模块组成:信息源选择采集子系统标引子系统建库子系统词表管理子系统用户接口子系统提问处理子系统8/29/202117信息检索系统开发与设计第一章1.2.2信息检索系统的逻辑构成信息源选择采集子系统信息源是检索系统的信息或数据来源,目前,信息检索系统中的数据主要来自各种公开文献,如一次文献中的期刊、图书、研究报告、会议

7、论文、专利文献、政府出版物、学位论文、二次文献中的文摘、索引和目录,三次文献中的百科全书、专科词典,名录、指南、手册等,有些系统还收录各种机构的内部资料,如实验记录、测试或观测结果、工程设计资料、统计资料等。本功能模块任务:根据系统的经营方针和服务对象的需要,以快速、经济的手段,广泛地、连续不断地采集各种信息源,为系统提供充足而适用的数据来源。8/29/202118信息检索系统开发与设计第一章1.2.2信息检索系统的逻辑构成标引子系统标引,就是根据一定的规则和程序,对文献内容进行分析,然后赋予每篇文献以一定数量的内容标识(分类

8、号、主题词、关键词等),作为存贮与检索的依据。标引作业通常与文献编目和文摘工作一起进行,然后把标引结果和其他描述事项填入工作单,交录入员去录入计算机中。8/29/202119信息检索系统开发与设计第一章1.2.2信息检索系统的逻辑构成建库子系统任务是建立和维护可直接用于计算机

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。