信息检索理论基础课件.ppt

信息检索理论基础课件.ppt

ID:57012732

大小:508.50 KB

页数:74页

时间:2020-07-26

信息检索理论基础课件.ppt_第1页
信息检索理论基础课件.ppt_第2页
信息检索理论基础课件.ppt_第3页
信息检索理论基础课件.ppt_第4页
信息检索理论基础课件.ppt_第5页
资源描述:

《信息检索理论基础课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第一章信息检索理论基础主要知识点(一)信息检索原理(二)信息检索技术(三)信息检索系统(四)信息检索语言(五)信息检索方法(六)信息检索评价(七)信息检索与数字图书馆信息基本知识一、信息的含义二、信息的基本特征一、信息的含义1信息的诸家之说(1)信息论的创始人申农(2)控制论的创始人维纳(3)《中国大百科全书》(4)《科学技术信息系统标准与使用指南---术语标准》信息是用来消除随机的不定性的东西。信息就是信息,既非物质,也非能量。按照狭义的理解,信息是用来消除不定性的东西。按照广义的理解,又有两种认识:从本体意义上说,信息泛指一切事物运动的状态和运动的方式。

2、从认识论的意义上说,信息是关于事物运动状态和运动方式的反映。信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不定性减少。2信息的基本含义(1)信息是世界上一切事物的状态和特征的反映。(2)信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性。一、信息的含义二、信息的基本特征1信息的客观性2信息的价值性3信息的时效性4信息的传递性5信息的共享性6信息的可存储性信息爆炸导致文献量急剧增加,重复量大;文献分布异常分散,查找利用困难;文献寿命越来越短吸收信息的能力不高对信息进行有序

3、化处理,可提高检索和利用的效率。信息检索原理—信息检索及其发展信息检索基本概念:根据特定课题需要,运用科学的方法,采用专门的工具,从大量信息、中迅速、准确、相对无遗漏地获取所需信息的过程即信息检索。广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,所以它的全称又叫“信息的存储与检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查询。完整的信息检索概念包括两项工作:(1)信息存储过程,即搜集、筛选、整理、积累现有信息及检索工具,建立信息检索系统;(2)信息检索过程,

4、即利用信息检索工具查找所需要的信息。图1.1信息检索原理原始文献信息需求信息特征提取检索提问表达检索标识系统信息特征标识检索提问标识检索系统标识匹配检索结果信息存储(标引)过程信息检索过程信息检索原理—信息检索及其发展(1)信息检索(InformationRetrieval)是“一种时间性的通讯形式”,“在时间上从一个时刻通往一个较晚的时刻,而在空间上可能还在同一地点”。这一看法,揭示了信息存储与获取两个环节是一种延时性的通讯形式。(2)信息检索的基本原理,是对信息集合与需求集合的匹配和选择。信息集合是有关某一领域的文献或数据的集合体,它是一种公共知识结构,

5、可以弥补该用户的知识结构缺陷。而匹配与选择则是一种机制,它负责把需求集合和信息集合进行比较,然后根据一定的标准选出符合需求的信息。信息检索原理—信息检索及其发展信息检索经历了从手工检索到机械检索再到计算机化检索的发展过程。1脱机检索(20世纪50年代)之前手工检索2联机检索(20世纪60年代末70年代初)3光盘检索(20世纪80年代)4网络检索(20世纪90年代)(1)信息检索的模型的含义:信息检索的模型就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译和抽象,表述为某种数学公式,再经过演绎、推断、解释和实际检验,反过来指导信息检索实践。(

6、2)布尔逻辑模型:它是由Y.Bar-Hillel在1957年首先提出的,他提出了将布尔逻辑应用于计算机检索的可能性,10年后,正式被大型文献检索系统所采用,并逐渐成为各种大型联机检索系统甚至是网络搜索引擎的典型、标准检索模式。布尔检索模型采用布尔代数和集合论的方法,用布尔表达式表示用户提问,通过对文献标识与提问式的逻辑运算来检索文献。信息检索原理—信息检索模型信息检索原理—信息检索模型在传统的布尔模型中,每一文献用一组标引词表示。如,表达式Di=(T1,T2,T3,…,Tm),为文献i,式中T1,T2,T3,…,Tm表示文献i中的所有标引词集合。每个提问式Q

7、除表示用户需求中的标引词组合外,还有各标引词的布尔组配。系统在对提问进行处理时,输出一个包含有该提问式的组配元(标引词)且符合组配条件(逻辑运算符)的文献集合。布尔检索模型因其简单、易理解、易实现、能处理结构化提问等优点,在信息检索系统中得到了广泛的实际应用。传统布尔检索模型的具体缺陷主要表现在以下五方面:①布尔检索式的非友善性,构造一个好的检索式不容易。②易造成零输出或输出过量。③无差别的组配元,不能区分各组配元的重要程度。④匹配标准存在某些不合理的地方。对于文献中标引词的数量没有评判,都一视同仁。⑤检索结果不能按照重要性排序输出。(3)向量空间检索模型:

8、向量检索是以向量的方式确定检索内容的方法,系统中的每

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。