欢迎来到天天文库
浏览记录
ID:5580454
大小:139.50 KB
页数:14页
时间:2017-12-19
《云南大学信息学院《信息检索》复习大纲》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第1章信息资源概论1、信息资源的涵义l信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。2、信息资源的类型及各自的特点l信息资源基本特征:(1)共享性(2)时效性(3)智能性(4)无限性与有限性并存(5)增值性类型:我们将信息资源区分为纸质文献型信息资源和电子型信息资源(包括电子出版物、网络信息资源)两大类型。第2章信息存储与检索基础1、信息存储与检索的基本原理l采用多种形式记录信息、排序信息的信息存储过称同时通过一定的设备、采用一定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与活动。(信息检索的基本原
2、理:为了促进信息资源的充分交流和有效利用,使用户在信息集合中快速、精确、全面地获得特定需要的信息资源,必须要对广泛、大量、分散、无序的信息进行搜集、记录、组织、存储,以建成各种信息存取系统。用户则根据检索需要,将需求转变为系统所能识别的检索式,再与存取系统中表征信息资源特征的标识进行逐一的相符性匹配与比较,两者完全一致或部分一致时,即为命中信息,可按用户要求从存取系统中输出。)2、信息存储与检索的历程l信息存储与检索走过了文献检索、情报检索的历程,并且正在向着知识检索的领域迈进:3、信息检索通常包括的四种类型1.关于文献的检索2.关于某事实或事项
3、的知识检索3.关于数值或数据的情报检索4.关于图像信息的信息检索4、索引的概念l索引(Index)是存取信息资源“地址”或“出处”的标识系统,是信息存储与检索的基本形式。索引的基本功能是指示知识点在正文或文献款目中的位置。传统的文本式检索工具通常由两部分组成,即文摘正文部分和辅助索引部分。l索引就是将信息集合中具有检索意义的事物名称及特征(如篇名、人名、书名、刊名、网页、网站、地名、分类号、主题词、分子式、专利号、报告号、名词术语等)抽取出来,著名其地址,按照字顺或逻辑分类等次序组织款目,从而为用户提供查询线索的存取工具。5、索引的款目结构中,例
4、如未来的地球人①/王佃亮②31③①②③分别代表什么(索引款目一般由索引标题词、说明语和地址参照项组成,而简单的索引款目往往只有索引标题词和地址参照项两部分内容)-14-①代表索引标题词②代表说明语(作者)③地址参照项(页码,文件顺序号)6、引文索引的概念把一系列具有引用与被引用关系的科学文献以多向线性的方式联系起来,提供一个以引证关系为依据来检索文献的新途径。引文索引的主要职能是,回答某作者的论文曾经被哪些人的文章所引证,这些文章何时发表在何种刊物上。第3/4章信息存取途径与检索策略1、布尔逻辑算符l用户利用逻辑算符构造检索式,可将一些具有简单概
5、念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。系统中采用的逻辑组配算符是布尔代数中的逻辑运算符AND、OR、NOT,故简称为布尔逻辑组配算符。这三种算符表示不同的逻辑关系,在构建提问检索式时必须正确选择使用。l逻辑“与”——AND或*l逻辑“或”——OR或+l逻辑“非”—NOT或-l布尔逻辑算符的优先执行顺序为NOT、AND、OR。l由布尔逻辑算符连接而成的检索式称为逻辑检索。2、位置逻辑算符l由于布尔逻辑算符不能限定检索词在检索记录中的位置关系,因此其检索结果常常不能满足精确检索的需要。为了弥补逻辑算符准确表达
6、提问要求的缺陷,提高检索效率避免误检,特规定了一些位置算符。也就是当使用文献记录中的自由词作为检索词进行检索时,词与词之间的逻辑关系则用位置算符组配。位置算符主要用于全文数据库查询。l位置算符不仅可用来组配带有前缀或后缀的检索词,也可用来组配带有逻辑算符的检索式。常用的位置算符有下列几种l①(W)或()—withl②(nw)表示在此算符两侧的检索词之间允许插入n个实词或虚词,两个检索词的词序不允许颠倒。l③(N)—“Near”l由(N)连接的检索词在记录中出现的顺序可以调换,但必须彼此相邻。l④(nN)l表示算符两侧的检索词(或称检索项)之间允许
7、插入n个词,且两检索项的位置可以调换。l⑤(F)—Fieldl表示算符两侧的检索词,必须同时出现在文献记录的同一字段中,如同一文摘或同一标题字段,同一题名字段等,此文便为命中,算符两侧检索词词序不变,夹在其间的其它词数量也不限。l⑥(S)—Subfieldl表示算符两侧的检索词必须同时出现在文献记录的相同子字段内,其检索词的顺序不限、夹在其间的词汇数量也不限,子字段通常由数据库确定。l⑦(L)—Linkl(L)算符通常用来表示算符两侧的检索词是从属关系,前者为上位概念,后者为下位概念;或算符左侧为主叙词,右侧为副叙词。l⑧(C)—CITATION
8、l-14-表示算符两侧的检索词可以不分字段、不按顺序,只要同时出现在一篇文献记录中即为命中,其作用和效果与逻辑算符“and”相同。l⑨(
此文档下载收益归作者所有