第四讲 信息检索

第四讲 信息检索

ID:33926719

大小:6.26 MB

页数:90页

时间:2019-02-28

第四讲 信息检索_第1页
第四讲 信息检索_第2页
第四讲 信息检索_第3页
第四讲 信息检索_第4页
第四讲 信息检索_第5页
资源描述:

《第四讲 信息检索》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四讲内容复习上一讲内容:信息、文献、知识概念的介入2.2信息检索第二章2.3信息检索途径2.4信息检索技术2.5信息检索工具2.2.2信息检索的类型KnowwhatKnowwhyKnowhowKnowwho约瀚·菲利普(PhilipJohn)美国普林斯顿大学物理系一个年轻大学生名叫约瀚·菲利普,在图书馆里借阅有关公开资料,仅用四个月时间,就画出一张制造原子弹的设计图。他设计的原子弹,体积小(棒球大小)、重量轻(7.5公斤)、威力大(相当广岛原子弹3/4的威力),造价低(当时仅需两千美元),致使一些国家(法国、巴基斯坦等)纷纷致函美国

2、大使馆,争相购买他的设计拷贝。泰勒美国核专家二十世纪七十年代,美国核专家泰勒收到一份题为《制造核弹的方法》的报告,他被报告精湛的技术设计所吸引,惊叹地说:“至今我看到的报告中,它是最详细、最全面的一份。”但使他更为惊异的是,这份报告竟出于哈佛大学经济专业的青年学生之手,而这个四百多页的技术报告的全部信息来源又都是从图书馆那些极为平常的、完全公开的图书资料中所获得的。信息检索的要素:信息检信息检索信息检索信息检索索的前的核心---的基础---的关键:提----信-信息获-信息源信息利用息意识取能力识如何找到信息-----途径检索途径:是

3、由提取信息源的外部特征与内部特征形成的检索点或检索入口.检索式:检索途径的表达(体现在报告个中)文献信息源获取途径文献特征检索途径检索技术检索式指搜索引擎或数据平台能理解和运算的查词串,由关键词(主题词等)、逻辑运算符、搜索指令(搜索语法)构成。关键词(主题词等)是检索式的主体,逻辑运算符和搜索指令根据具体的查询要求从不同的角度对关键词进行搜索限定。检索技术检索语言检索语言•即情报检索语言。•是根据信息检索的需要创造出来•是在文献检索领域中用来描述文献特征的语言。•是人工语言。根据信息检索的需要而创制的。检索语言的功能:一,描述文献的

4、外表特征(书刊篇名——题目索引,著作姓名——著作索引,文献序号--序号索引,引用文献--引文索引)二、描述文献内容特征1、体系分类语言——分类索引2、主题语言(标题词——标题词索引。单元词——单元词索引,关键词——关键词索引,叙词——叙词索引)3、代码语言(分子式等——分子式索引等各种专用索引,结构式——结构式索引)检索语言种类:一、自然语言(关键词、题名即标题、全文、引文、作者和摘要等)二、人工语言(分类检索语言、主题检索语言、代码检索语言)检索语言案例主题:高性能聚芳硫醚(PAS)树脂的合成本课题涉及的提问特征有两个主要的层面第一

5、层面聚芳硫醚涉及的主题词或关键词有:1.聚芳硫醚2.聚苯硫醚3.聚芳硫醚砜4.聚苯硫醚砜5.聚芳硫醚酮6.聚苯硫醚酮7.聚芳硫醚酰胺8.聚苯硫醚酰胺等第二层面合成涉及的主题词或关键词有:9.合成10.制备11.生产等信息检索原理示意图知识域检索工具存储过程标引检文献分析信息著录形成信息输入索信信息特征语标识检息言检输出索和名索结检索分析检索选用称形成检索提检索系果提问规统课题范问标识特征检索过程信息存储是基础检索语言是桥梁信息检索是目的检索技术:信息检索技术是指利用现代信息检索系统,如联机数据库、光盘数据库和网络数据库检索有关信息而采

6、用的相关技术,常用的有布尔、词位、截词和限制技术。2.5.1布尔检索常用的有:(1)逻辑与(2)逻辑或(3)逻辑非逻辑与1.含义:是一种具有概念交叉或概念限定关系的组配。2.算符:“*”或“AND”或“并且”等。3.特点:增强专指度,提高查准率。4.举例:聚甲醛AND增韧,表示两个概念应同时包含在一条记录中。逻辑或1.含义:是一种具有概念相同、概念相关或概念并列关系的组配。2.算符:“+”或“OR”或“或者”等。3.特点:扩大检索范围,提高查全率。4.举例:废水OR污水,表示这两个相关概念分别在一条记录中出现或同时在一条记录中出现。逻

7、辑非1.含义:是一种具有概念排除关系的组配。2.算符:“-”或“NOT”或“不包含”等。3.特点:提高查准率,影响查全率。4.举例:制药废水NOT放射废水,表示检索出的记录中要排除含有“放射废水”的记录。2.5.2词位检索1.含义:具有限定检索词词间位置关系的组配功能,可弥补布尔逻辑组配只是定性规定检索词的范围,2.算符:(W)与(nW)用于Dialog联机和光盘系统,相邻两词词序不能颠倒;SAME用于ISIWebofScience系统中,相邻两词在同一句子中,词序任意。3.特点:达到提高检准率的效果。4.举例:gas(w)c

8、hromatograph;airSAMEpollution2.5.3截词检索1.含义:是指在检索词的合适位置进行截断,然后使用截词符进行处理,可节省输入的字符,又可达到较高的查全率。较常用的是后截词和中截词。按所截断的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。