第3章 信息检索基础

第3章 信息检索基础

ID:44954346

大小:958.00 KB

页数:47页

时间:2019-11-06

第3章  信息检索基础_第1页
第3章  信息检索基础_第2页
第3章  信息检索基础_第3页
第3章  信息检索基础_第4页
第3章  信息检索基础_第5页
资源描述:

《第3章 信息检索基础》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第3章信息检索基础3.1信息检索概念3.2信息检索原理3.3信息检索语言3.4信息检索系统与检索工具3.1信息检索概念3.1.1信息检索定义“检索”一词源自英文“Retrieval”,其含义是“查找”。特大量相关信息按一定的方式和规律组织和存储起来,形成某种信息集合,并能根据用户特定需求快速高效地查找出所需信息的过程称为信息检索。从广义上讲,信息检索包括存储过程和检索过程;对信息用户来说,往往仅指查找所需信息的检索过程。信息检索实质上就是把表达用户信息需求的提问特征,同检索系统中的信息特征标识进行类比,从中找出相一致的信息。下一页返回3.1信息检索概念信息的存储主要包括对在一定专业范

2、围内的信息选择基础上进行信息特征描述、加工并使其有序化,即建立数据库。检索是借助一定的设备与工具,采用一系列方法与策略从数据库中查找出所需信息。存储是检索的基础,检索是存储的逆过程。在现代信息技术环境下,信息检索从本质上讲,是指人们希望从一切信息系统中迅速、准确地查找到自己感兴趣的有用信息,而不论它的出现形式或媒体介质。传统的信息检索,主要是根据文献的内、外部特征,用手工方式实现。现代以计算机为核心的信息检索技术,开辟了信息处理与信息检索的新时代。从计算机处理数字信息发展到处理字符信息,又到能够处理静、动态图像(形)信息乃至声音信息等。这一过程不断拓展着信息检索的领域,丰富着信息检索

3、的内容,提高了信息检索的速度。上一页下一页返回3.1信息检索概念3.1.2现代信息检索技术1.全文检索最早的全文检索系统是1959年美国匹兹堡大学卫生法律中心研制的。全文检索系统的出现为人们获取文献原文而非文献线索信息提供了一条有效途径。全文检索是以文献所含的全部信息作为检索内容的,即检索系统存储的是整篇文章或整部图书的全部内容。检索时可以查找到原文以及有关的句、段、节、章等文字,并可进行各种频率统计和内容分析。全文检索主要是用自然语言表达检索课题,较适用于某些参考价值大的经典性文献,如各种典籍、名著等。全文检索是当前计算机信息检索的发展方向之一。上一页下一页返回3.1信息检索概念2

4、.多媒体检索多媒体检索技术是把文字、声音、图像(形)等多种信息的传播载体通过计算机进行数字化加工处理而形成的一种综合技术。多媒体技术的应用使信息检索系统进一步满足了社会对多元化信息的需求。(1)视频检索。其用途比较广泛,如关于卫星云图变化、人体内器官运作等。这种检索就是要在大量的视频数据中查找所需要的视频片断。用户需求往往具有层次化特征,比如要检索关于某一个镜头中的某个主题的视频段或某些图像帧等。上一页下一页返回3.1信息检索概念(2)声音检索。它包括:用序号查找一段声音;以匹配方式检索给定样值的声音,对声音文本的检索等。(3)图像检索。基于内容的图像检索技术是一种综合集成技术。它通

5、过分析图像的内容,如颜色、纹理等建立特征索引,并存储在特征库中。用户查询时,只要把自己对图像的模糊印象描述出来即可在大容量图像信息库中找到所要的图像。用户一般对颜色、纹理、形状以及目标的空间关系特征比较敏感,因此常用基于内容的检索方法。具体包括:基于颜色特征的检索,基于纹理特征的检索,基于形状特征的检索。上一页下一页返回3.1信息检索概念3.超媒体及超文本检索传统文本都是线性的,用户必须顺序阅读。超媒体与此不同,它是一种非线性的网状结构。超媒体系统主要提供基于浏览的检索方式和基于提问的检索方式。(1)基于浏览的检索方式。超媒体系统的数据库是一个多维空间结构的文献链路网。链路网将同一篇

6、文献或不同文献(或文献代表)的相关部分结构化地连接起来,这是传统的检索系统所无法实现的。这种组织结构决定了它主要通过非线性浏览获取信息,即通过跟踪信息节点间的链路在网络中移动的过程,并非直接检索。通过浏览不但可以了解数据库的组织,从中查询与课题相关的信息,而且可以不断得到新节点的启发,重新调整检索的目标使获取的信息更切题,或者通过浏览信息片段动态地建立新的查询路径。上一页下一页返回3.1信息检索概念(2)基于提问的检索方式。基于浏览的查询是从“哪里”到“什么”,而采用提问的方式则是从“什么”到“哪里”,与浏览方式相比,提问方式查找目标明确,准确度高,较适于大型系统。但该方式对用户要求

7、高,用户必须熟悉专门化检索语言和检索策略。3.1.3信息检索类型信息检索可以按照不同的标准划分成各种类型。上一页下一页返回3.1信息检索概念1.按检索内容区分按检索内容区分,信息检索可以分为文献信息检索、数据信息检索和事实信息检索。1)文献信息检索文献信息检索(DocumentInformationRetrieval)是以文献(包括题录、文摘和全文)为检索对象的信息检索。即利用相应的方式与手段,在存储文献的检索工具或文献数据库中,查询用户在特定的时间和条件

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。