计算机信息检索

计算机信息检索

ID:21257595

大小:141.50 KB

页数:4页

时间:2018-10-20

计算机信息检索_第1页
计算机信息检索_第2页
计算机信息检索_第3页
计算机信息检索_第4页
资源描述:

《计算机信息检索》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、一.名词解释1.信息检索:广义来说,指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程,包括“存”和“取”两个基本环节;狭义理解,一般只涉及“取”,信息检索也可称为“信息查询”或“信息查找”。2.联机信息检索:指用户利用检索系统网络的终端设备,通过通信线路,运用一些特定的指令和检索策略与世界上的信息检索系统,进行质检的人机对话,从检索系统的数裾库屮查找出用户所需要的特定信息,并将检索结果与过程下载,S示和打印出来的过程。3.CBR:基于内容的检索,指根据多媒体对象的听、视觉特

2、征及其中蕴含的内容和语义特征进行检索,并希望能够借助于模式识别、语音识别、图像理解等相关领域的研宄成果,对多媒体数据的听、视觉特征和语义特征进行自动(半自动)的分析、表达和组织。4.网络信息源:指所有以电子数据的形式把文字、阁像、声音、动画等多种形式的信息存贮在光、磁等非纸质介质的载体屮,并通过网络通信、计算机或终端等方式再现出来的资源。5.搜索引擎:搜索引擎有广义与狭义之分。广义的搜索引擎泛指网络上提供信息检索服务的攻击或系统。狭义的搜索引擎主要是指利用网络A动搜索软件对INTERNET(主要是WEB)网

3、络资源进行收集、组织并提供检索服务的一类信息服务系统。6.URL:统一资源定位符(UniformResourceLocator,缩写为URL)是对⑷*以从互联M上得到的资源的位置和访问方法的一种简沽的表示,是互联M上标准资源的地址。互联M上的每个文件都有一个唯-的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。7.顺排/倒排文档:文档的概念是指数据库内容的组织形式。一般地说,一个数据库至少包括一个顺排文档和一个倒排文档。(1)顺排档,也称为主文档、引文文档,它是按记录存取号的大小顺序排列记录而成

4、的文档。文档越是新,记录存入文档的时间越是晚,记录的存取号就越大。(2)倒排挡,是指把数据库中记录的一切可检字段或属性值(称检索标识,如著者,主题词等,不包括存取号)抽出,按某种顺序(字母或数字顺序)重新加以组织后得到的特征标识文档。8.检索语言:是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息A容和检索课题内容的概念及其相互关系的一种概念标识系统。检索语言是用来描述信息源特征和进行检索的人工语言,可分为规范化语言(体系分类语言、主题词语言)和非规范化语言(自然语言)两类。

5、9.白然语言:索引词汇直接来A系统所处理的文献或提问本身,使用前未经过优选和规范化处理的一类检索语言。10.超文本:是一个非线性的网状结构,它以结点为单位组织信息,在结点与结点间通过链接加以连接,构成表达特定内容的信息网络。二.简答1.简述一下因特网信息检索的特点(1)检索范M大(2)检索效率高(3)检索工具强大(4)信息冗余2.搜索引擎的基本工作原理搜索引擎的基本模式是:运行特定的网络搜索程序,定期地搜索Internet的各个站点,送冋收集到的文献信息(包括Web页面和新闻组文章等),并利用索引软件对这些

6、文献进行自动标引,加入集中管理的索引数据库;同吋,在Internet上设立提供检索界面的Web站点,由用户输入提问检索式,通过特定的检索软件,查找其索引数据库,给出与检索式相匹配的査询结果,供用广浏览2.请描述检索系统的“提问处理/检索匹配”子系统的主要作业流程(1)接受用户提M(2)提问校验,包括对提问式进行语法格式用同等方面的检查,主要由程序自动完成。(3)提问加工,指对源提问式进行解释性或编译性的加工,生成便于机器处理的目标提问式。(4)检索匹配,即将0标提问式与数据库索引文档的记录进行匹配,把满足要

7、求的数据库记录输出到结果文档中,或直接显示在检索屏幕上。具体的匹配策略可以是精确匹配,也可以是局部匹配。精确匹配是指要求结果记录(标识)中包含的需求模式必须与提问式所表达的模式完全匹配,才能作为命屮结果输出。局部匹配则是指只要求结果记录(标识)中包含的需求模式与提问式所表达的模式部分匹配,即力命屮。3.网络信息检索工具的评价(1)收录范围(2)查全率(3)査准率(4)响应时间(5)用户负担(6)输出方式(7)新颖程度,更新速率4.因特网搜索引擎的划分类型【书P188】按信息内容的组织方式划分:1)目录式搜索

8、引擎(directory,catalog)Directory提供巾网页作者所呈送的因特网的链接集合,同时对这些资源作出评价并组织成主题目录。2)机器人搜索引擎机器人搜索引擎不是靠人工发现和甄别信息,而是由一个被称作“蜘蛛”的计算机程序在网中爬行,依据一定的网络协议在因特网巾发现、加工、整理信息,并力用户提供检索服务。机器人搜索引擎由3部分组成:a、搜索软件b、索引软件c、检索软件。重要的机器人搜索引楚有:Alta

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。