信息检索理论基础

信息检索理论基础

ID:45889028

大小:485.50 KB

页数:137页

时间:2019-11-19

信息检索理论基础_第1页
信息检索理论基础_第2页
信息检索理论基础_第3页
信息检索理论基础_第4页
信息检索理论基础_第5页
资源描述:

《信息检索理论基础》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章 信息检索理论基础第一节信息存储与检索基本原理第二节信息存储与检索的发展第三节信息存储与检索语言细心的同学可能已经发现,在涉及“检索”内容时,有时提到“信息检索”,而有时又提到“文献检索”。那么,它们到底有何区别?其本质及内涵是什么?检索的基本原理又是怎样的呢?下节将回答这些问题,也是要求同学们重点理解和掌握的主要内容。第一节信息存储与检索基本原理一、基本概念信息存储与检索概念的起源信息存储与检索的含义1、信息检索概念的起源信息检索(Informationretrieval)起源于原文献检索、情报检索,在1998年设置的

2、专业目录中得以改变。不同的称谓产生于不同的历史背景在20世纪中叶以前,信息存储传播主要以纸质为载体,信息检索活动也围绕文献的获取和控制展开。因此,信息检索研究关注的是如何检索利用文献中记录的信息,从而导致“文献检索”成为“信息检索”的同义词,早期的研究文献中几乎不使用“信息检索”这一概念。20世纪50年代以后,社会信息传播与存储载体呈现多元化,人们不再拘泥于载体研究信息检索,于是开始使用“情报检索”一词。由于汉语中“信息”一词较“情报”一词含义更为宽泛,加之英语词汇“Information”具有“情报”、“信息”的含义,因此,

3、近年来人们越来越倾向于将“文献检索”、“情报检索”转变为“信息检索”这一更具兼容性的概念,以便对信息检索实践起到更全面的指导作用。目前的现状是,上述几个概念同时使用,因为它们的目的是获取信息。由“信息检索”改为“信息存储与检索”是为了更好地明确“信息存储”与“信息检索”的关系,从而更有效地进行信息的获取。2、信息存储与检索的含义信息存储是指将大量无序的信息集中,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。而信息检

4、索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。信息检索的概念有狭义和广义。 狭义的信息检索则仅指上述过程的后半部分,即从某一信息集合中找出所需的信息的过程,相当于人们通常所说的信息查询(InformationSearch)。广义的信息检索包括信息的存储和检索两个过程(StorageandRetrieval)。全称又叫“信息存储与检索”(InformationStorageandRetrieval)。目前广义的信息检索和狭义的信息检索概念被同时使用着。第一节信息存储与检索基本原理二、基本原理信息存储基本原理

5、信息存储与检索基本原理1、信息存储基本原理书本式文献的传统存储方法是主要指印刷型检索工具的编制,包括图书、期刊、专利、科技报告、政府出版物、技术标准、会议论文、学位论文、产品样本、档案十大信息源的分类存储,由这套系统决定的手工检索体系使文献分类等描述文献内容的特征处于核心地位,文献篇名、作者名等描述文献外表特征则是天然的补充要素,加上主题,构成手检时按分类、主题、号码、作者名检索的四大途径。机读信息则以数据库(Database)形式存储。信息被分类、编码、标识且以数据形式存入数据库后,计算机就能按电子数据方式进行处理并检索。2

6、、信息存储与检索基本原理信息检索的基本原理就是,为了文献信息的充分交流和有效利用,让信息用户能准确、全面、及时地获取满足特定需要的信息,通过对广泛、大量、分散、无序的文献信息进行搜集、加工、组织、存储,建成各种各样的检索系统,在统一存储过程和检索过程所用检索语言和名称规范的基础上,将用户表达检索课题的标识与检索系统中表达文献信息内容和形式特征的标识进行相符性比较(匹配),凡是双方标识一致(完全一致或部分一致)的,就将具有这些标识的文献信息按要求从检索系统中输出。检索系统输出的文献信息既可能是用户需要的最终信息,也可能是用户需要

7、的中介信息(比如文献线索),用户依此中介信息的指引,可进一步获取需要的最终文献和信息。输出标引著录信息存储与检索过程文献信息检索课题文献信息标识(标引词)检索提问标识(检索词)文献信息特征检索提问特征检索语言和名称规范检索系统(标识匹配)检索结果分析分析选用形成形成检索提问特征检索语言和名称规范第一节信息存储与检索基本原理三、相关概念检索系统检索系统的评价检索工具1、检索系统检索系统是指拥有特定的存储和检索技术设备,存储有经过加工的信息资源,供用户检索所需信息的工作系统。信息检索系统通常应是一个拥有选择、整理、加工、存储、查找

8、信息的设备与方法,并能向用户提供信息服务的多功能开发系统。一般情况下指的是计算机检索系统。计算机检索系统通常由计算机硬件、软件、数据库和通讯网络构成。计算机硬件计算机硬件是系统采用的各种硬设备的总称,主要包括具有一定性能的主计算机、外围设备以及与数据处理或数据传送有关的其他设

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。