第三章-信息检索基本方法.ppt

第三章-信息检索基本方法.ppt

ID:61774042

大小:1003.50 KB

页数:54页

时间:2021-03-20

第三章-信息检索基本方法.ppt_第1页
第三章-信息检索基本方法.ppt_第2页
第三章-信息检索基本方法.ppt_第3页
第三章-信息检索基本方法.ppt_第4页
第三章-信息检索基本方法.ppt_第5页
资源描述:

《第三章-信息检索基本方法.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章信息检索基本方法3.1信息检索语言与检索途径3.1.1信息检索语言的类型及特点信息检索语言是用来描述文献特征,表达主题提问的一种专门的人工语言,是由给定领域中一切可用来描述信息内容和信息需求的词汇或符号,及其使用规则构成的供标引和检索的工具。如各种分类法、主题词表、叙词表都属于信息检索语言。1.根据结构原理划分分类语言指用分类号和类名来表达信息的内容主题概念,并按知识门类的逻辑次序将信息资源系统地加以划分和组织的语言。分类语言主要分为等级体系型和分面组配型。例如下面的中图分类法就是等级体系型分类语言。中图分类法主题语言:以

2、主题词来表达信息主题概念的语言。是计算机信息检索语言的主流。通常又分为以下几种:(1)标题语言(2)叙词语言(3)关键词语言(4)元词语言(1)主题语言之一:标题语言概念:采用经过词汇控制的自然语言,以经过规范化的名次术语为标识,直接表达文献和提问的主题。标题语言是最早出现的并得到广泛使用的一种语言。标题语言的规范工具为标题表。如《美国国会标题表》就是国内外广泛使用的标题表。标题有单级标题和多级标题两种。A、单级标题。如计算机computer英国的《科学文摘》(SA)的主题索引采用的是单级标题形式。B、多级标题。主标题和副标题组

3、成。如,machinetools木工机床control设计美国的《EI》、《CA》的主题索引均使用了多级标题形式。主标题的构成有3种:A、正叙式标题如空气污染(AirPollution)B、倒叙式标题例如,Bridge,Wood(木桥)。C、并列式标题例如,RoadsandStreets(2)主题语言之二:叙词语言概念:以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主题语言。专门有叙词表。(有3种)A、交叉组配例如,“人工林”和“防护林”表达为人工防护林。B、限定组配例如,“电子计算机”和“存储速度”

4、的组配表达了“电子计算机的存储速度”这一主题。C、组合组配,又叫并列组配。例如,”计算机“,”应用“和”图书馆“表达了”计算机在图书馆中的应用“这一主题。叙词表通常由字顺表、范畴表、词族表或其它附表构成。我国图书情报机构广泛使用的《汉语主题词表》是世界上最大型的综合性叙词表之一。叙词语言的特点1、规范性强:叙词语言事先经过规范化处理,列于叙词表中,标引和检索都从叙词表中选词,保证了标引和检索的一致性。2、利用叙词的组配,可用有限的叙词表达各种复杂的主题。3、叙词语言从单元概念出发提示文献内容,可准确、全面揭示文献的主题,提高标引

5、深度和专指度。4、检索入口多,大大提高检全率。5、同时使用计算机系统和手工检索工具。(3)主题语言之三:关键词语言概念:关键词语言与其它主题语言的区别在于它没有经过规范化处理,属于非受控语言。而主题词语言属于受控语言。关键词语言的基本原理是直接以自然语言的词语作为表达文献和提问的标识。故不必编制专门的词表。又分为单纯关键词索引(EI常用)、题内关键词索引(美国的《化学题录》采用)、题外关键词索引、词对式关键词索引(SCI中的轮排主题索引属于此类)等。(4)主题语言之四:元词语言为了克服标题语言的不足而发展起来的一种主题法类型。元

6、词:从文献中抽选出来的,从字面上不可再分割的表达最基本的概念单元的词汇。元词语言元词语言是以元词作为主题标识,通过字面组配来表达主题概念的语言。例如,“物理”和“贸易”就属于元词,而“知识经济”和“主题标引”不属于元词。例如,“经济文献检索”这一主题,就必须通过“经济”、“文献”和“检索”3个单元词进行标引和组配检索。《美国化学专利单元词表索引》采用的就是单元词索引形式。早期的元词系统属于自然语言系统,一般不建立词表,后期的元词系统有相应的词表。分类主题一体化语言是指在一个检索系统中,对它的分类表部分和叙词表部分,就术语、参照、

7、标识、索引等实行统一的控制,即一个分类系统与一个主题系统互相兼容。简单而言,分类主题一体化语言是分类语言与主题语言的有机结合。分类主题一体化语言例如《中国分类主题词表》就是在《中图法》类目与《汉表》主题词对应的基础上,将分类法与主题法、先组与后组融为一体的文献标引和检索工具。其中的《分类号——主题词对应表》和《主题词——分类号对应表》是分别从分类角度和主题角度进行分类主题一体化标引的工具。代码语言常用的有分子式索引、专利号、标准号、报告号、化合物登记号等。引文语言引文语言就是利用文献之间引用与被引用的关系作为文献内容主题标识,并

8、以此标引和检索文献的语言。例如文献作者在文献最后列出参考文献,这就是引文。该作者所创作的文献完成后也将汇入知识集合中,再后来的人又可将其作为引文加以利用和记录。文献间的这种引证关系,不仅反映了科学技术的交流和反馈,也启发人们通过追溯这种引证关系,找到一系列内容相

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。