3信息检索语言

3信息检索语言

ID:36191326

大小:501.50 KB

页数:32页

时间:2019-05-07

3信息检索语言_第1页
3信息检索语言_第2页
3信息检索语言_第3页
3信息检索语言_第4页
3信息检索语言_第5页
资源描述:

《3信息检索语言》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、3信息检索语言检索语言是信息检索系统中信息存储与检索用语,用户与检索系统藉以交流、互动的媒介。受控语言受控语言与自然语言自然语言结合3.1信息检索语言基础理论研究信息检索语言的类型按规范形式可以分为:规范检索语言和自然检索语言按操作方式可以分为人工检索语言和机器检索语言按表现形式可分为专有型检索、语言代码型检索语言和语词型检索语言按受控方式可分为前控检索语言和后控检索语言按检索对象可根据具体检索对象的类型不同形成特定的检索语言:文献检索语言、网络检索语言、图书检索语言、档案检索语言情报学的认知观对信息检索语言研究的影响信息检索过程是个非常复杂的认知过程,是一种由已知通向未知过程。

2、原始信息概念结构可传递的形式两者比较知识的不足不足知识的可交流结构3.1受控检索语言的分析比较受控语言是用于对自然语言进行事先规范的人工语言优势:文献描述与概念表达的惟一性、专指性,便于提高检准率通过揭示同义词、近义词和相关词等词间关系可以提高检全率缺点:受控语言因人工制作,成本高人为因素影响大更新困难,新学科、新技术等新概念难以及时更新分类检索语言一般认为文献分类是以科学分类体系为基础钱学森提出的现代科学分类体系是:自然科学、社会科学、数学科学、系统科学、思维科学和人体科学钱老认为:人类的知识系统由四部分组成:不成文的实际感受、实际经验知识库、各门科学技术、哲学陆近春认为整体分

3、解的方法,把宇宙物质世界看成一个体系宇宙物质世界地球表层系统及科学社会系统及科学人体系统及科学精神系统及科学思维系统及科学分类的电子化《中国图书馆图书分类法》A马克思主义、列宁主义、毛泽东思想、邓小平理论B哲学、宗教C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学、安全科学Z综合性图书书生之家的主页法律国际法国际私法主题检索语言叙词表什么是叙词表:叙词表又称主题词表(Thesaurus),指以规范化的自然语言语

4、词作为文献主题的标识,通过叙词的概念组配表达主题概念。叙词表的作用:叙词表对普通用户来说,是一种简化的词典。而在图书馆员看来,叙词表是主题词表的一种,用概念词汇来标引文献。能够多检索途径、多因素组配、灵活扩检、缩检、改变检索范围,具有专指度好,同时具有一定可扩展性的优点。同关键词表相比,叙词表人为干预的程度较强,而关键词表常常从文献本身直接抽取词汇形成各种索引,自动化处理的性能较好。分面和组配:复杂的主题经过若干分面分析,归结为一系列单一的概念,相反的过程也是一样。充分体现了叙词表的标引和检索能力。在学科-概念组配型检索语言中,学科分类系统面和事物分类系统面成为标识主题的两个主要

5、分面,两个面可以互相组配。当按学科聚类,藉由事物及部分分面进行复分;当按事物聚类时,藉由学科分面进行复分。同时,时间和空间自然也可以构成合理的分面。叙词关系单元:现在标引的观点是采用具体叙词表(如Ei)的词汇来标引具体的WEBRESOURCE,但是理想的做法是采用具体概念(CONCEPT)来标引具体的WEBRESOURCE,术语(TERM)是概念的载体(容器),可以同叙词表的微观结构对应。可以说在网络环境下存在的不是一部部叙词表,而是一个个用词汇表示的概念,概念的某种顺序集合就形成了某个现有的词表。现有的叙词表的微观结构可以作为一个“叙词关系单元”面目出现,从而形成“WEBRES

6、OURCE”的自我描述机制。叙词的关系:“用、代、属、分、参”例:资源描述框架RDF开发的的有关环境的叙词表和叙词网络工具针对叙词表在网络环境下的应用,他们共同提出了一套标准,用于基于rdf格式,HTTP通信协议的分布式叙词通讯机制。该通信机制是建立在如下前提下:1.每个叙词表由一个URL表示,这样可以有效避免叙词表的二义性。如:叙词表ceres的URL为:http://ceres.ca.gov/cgi-bin/thesauri/CERES2.每个叙词由一个URL表示。格式为“叙词表URL?叙词名称”,这样可以准确的标识一个叙词条目和改叙词所在的叙词表。如:叙词条目“Ecosys

7、tems”的URL为:http://ceres.ca.gov/cgi-bin/thesauri/CERES?Ecosystems3.客户端通过HTTP协议向HTTPD服务器请求叙词。4.服务器端返回给客户端的信息采用RDF的数据格式。3.3自然语言处理与自然语言检索什么是自然语言就是指人们日常说话、写文章和交流思想所使用的语言,也有人将自然语言定义为书面用语。在信息检索中自然语言是包括关键词、自由词和出现在文献题名、摘要、正文或参考文献中具有实质意义的词语。自然语言的优点:降低标

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。