《信息检索基础》课件

《信息检索基础》课件

ID:38648683

大小:2.42 MB

页数:63页

时间:2019-06-17

《信息检索基础》课件_第1页
《信息检索基础》课件_第2页
《信息检索基础》课件_第3页
《信息检索基础》课件_第4页
《信息检索基础》课件_第5页
资源描述:

《《信息检索基础》课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章信息检索基础2.1信息检索概述2.1.1信息检索(InformationRetrieval)定义将信息按一定方式组织和存贮起来,并针对用户的需求找出所需要的信息的过程。21信息源信息分析、著录、标引信息的表示检索语言用户需求分析用户检索提问匹配过程输出检索结果数据库2.1.1信息检索原理信息检索基本原理的核心是用户信息需求与文献信息集合的比较和选择,信息检索实质上是两者匹配的过程。2.1.2信息检索类型事实信息检索依检索内容划分文献信息检索数据信息检索信息检索类型2.1.2信息检索的类型数据检索:检索的结果是数据或数值。如某种材料的电阻;某变压器的参数;化学分子式、数据图表等。<手册>

2、事实检索:检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的。<年鉴>文献检索:检索的结果是文献资料。查找相关文献的内容、出处、收藏单位等。如系统地查找数控机床相关方面的文献。<论文>文献检索是信息检索的核心部分。从性质上说:文献检索是一种相关性检索,检索的结果是与课题相关的文献或文献线索,而不直接解答用户所提出的技术问题本身;事实检索与数据检索则是确定性检索,检索的结果是用户所需的确切的数据或事实。2.1.3信息检索的发展简要历程手工检索阶段世界四大检索工具(SCIEIISTP

3、ISR),1665年《学者周刊》计算机联机检索阶段1965年ORBIT—DIALOG检索系统网络检索方式检索软件的开发信息检索的未来阶段:智能化、高效化、人性化2.1.4信息检索的意义知识有两种,一种是我们自己知道的某主题的知识,而另一种则是我们知道什么地方能够找到知识的知识。--赫伯特信息检索与利用能力的培养,是培养和提高大学生创新能力的前提。2.2信息检索途径检索途径就是检索文献的出发点及路线,也称“检索点”。信息检索与信息存储是互逆的过程,存储在检索工具和系统中的有些著录项或标引字段是可以提供检索的,这些著录或标引字段就是检索入口。信息检索途径一般包括文献信息的内容特征途径和外部特征途

4、径。根据信息外部特征和内容特征的不同标识,检索途径可作如下划分:检索途径信息外部特征信息内部特征分类途径主题途径关键词途径题名途径著者途径机构途径代码/序号途径其他途径分类途径以学科性质和内容的相应类目、类号为特征标识的检索方法。分类途经检索与分类法是相对应的。目前,我国通用的分类法主要有三种:A《中国图书馆图书分类法》(简称《中图法》)B《中国科学院图书馆图书分类法》(简称《科图法》)C《中国人民大学图书馆图书分类法》(简称《人大法》)《中图法》简介《中图法》有22个大类,分类号采用字母与阿拉伯数字相结合的号码;其中字母代表大类,数字代表大类下的细分。A马克思主义、列宁主义、毛泽东思想、N

5、自然科学总论邓小平理论O数理科学和化学B哲学P天文学、地球科学C社会科学总论Q生物科学D政治、法律R医药、卫生E军事S农业科学F经济T工业技术G文化、科学、教育、体育U交通运输H语言、文字V航空、航天I文学X环境科学、劳动保护科学J艺术Z综合性图书K历史、地理《中图法》分类实例分解为:I文学I2中国文学I24小说I247当代作品(1949年~)I247.5新体长篇、中篇小说主题途径指用户根据所确定的主题词,利用主题词表和主题索引实施检索的途径。特点通过主题途径获取的信息专指性强,但查全率较低,对用户的检索知识要求很高。查看徐静蕾在新浪的博客主题途径实例关键词途径指用表达信息主题内容起关键作用

6、的词组或单词实施检索的途径。特点关键词是一种很灵活的词组或单词,它不需规范化词表,使用比较方便。关键词途径实例小新想学习英语,希望在网上找些与他同样需求的人一起学习、交流。提取关键词:英语、论坛/QQ群/讨论组/博客圈…注意:各种检索途径都有自身的优点和缺点,综合利用多种检索途径,能够提高文献查全率,仅用一种途径去查找,难免产生漏检。2.3检索语言检索语言是用于描述信息系统中信息特征和表达用户信息提问的一种专门语言,是信息存储与检索共同遵循的规则。主题语言分类语言标题词语言关键词语言叙词语言检索语言2.3.1检索词的提取检索词提取原则选用各学科的专业术语,不能用通俗用语选用意义明确的词汇,不

7、用一般的、通用性的词汇充分利用规范词(叙词或主题词)提取检索词的方法提取检索词的方法,通常有:切分删除补充切分切分到词对课题语句进行切分,即以词为单位划分句子,切分一定要彻底,必须到词为止,同时也要适度,不能因切分而改变语义。例:基于DSP芯片TMS320DM642开发的虹膜识别系统基于

8、DSP

9、芯片

10、TMS320DM642

11、开发

12、的

13、虹膜

14、识别

15、系统删除删除虚词删除过分宽泛和过分具体的限定词删除存在蕴涵关系

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。