计算机信息检索基础

计算机信息检索基础

ID:21495292

大小:5.45 MB

页数:75页

时间:2018-10-19

计算机信息检索基础_第1页
计算机信息检索基础_第2页
计算机信息检索基础_第3页
计算机信息检索基础_第4页
计算机信息检索基础_第5页
资源描述:

《计算机信息检索基础》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章计算机信息检索基础陈强“信息爆炸”知识的门类和数量迅速倍增知识的载体和传输方式日新月异每日新增网页近百万张2010年全球网站数量突破11亿,2012年16.44亿文献增速70年代每7年翻一番1999年每1年半翻一番2013年每8小时翻一番一、计算机信息检索原理计算机信息检索:用户利用数据库获取所需信息的过程。即:计算机将输入机检系统的用户提问标识(检索词)与已存贮在系统中数据库内的文献特征标识(标引词)进行匹配比较,凡符合给定的比较原则和逻辑运算条件者即为命中文献。计算机信息检索特点检索速度快效率

2、高检索方便实现资源共享检索内容新数量大手段灵活途径多样快速、准确地获得结果缺点:收费、有时间限制、回溯性差,无法查久远的或最新的文献。检索特征标识=系统中的信息特征标识检索标识系统标识匹配一致二、检索软件类型检索软件即用户与系统对话的界面,可分为以下两种:指令型通过直接输入指令进行检索菜单型通过屏幕菜单引导完成检索。指令检索示例肝肿瘤and(铜or铁)andpy>=2005菜单检索示例三、数据库数据库定义数据库结构数据库类型1.数据库定义相互关联的数据在计算机外存储器上有序的集合.2、数据库结构Fram

3、eworkofDatabase文档(File)数据库中一部分记录的集合综合性数据库多按学科划分文档记录(Record)数据库的基本信息单元,每条记录都描述了原始信息的各项外表特征和内容特征。字段(Field)组成记录的数据项(检索项),一个字段代表一项特征。文档记录字段字段名称及代码基本字段:字段名称段码文摘(Abstracts)AB题目(TitleWord)TI主题词(Descriptor)DE标识词(Identifier)ID辅助字段:作者(Authors)AU作者单位(CorporateSourc

4、e)CS刊名(JournalName)JN年代(PublicationYear)PY3、数据库类型typesofdatabases文献数据库数值数据库事实数据库多媒体数据库文献数据库书目数据库全文数据库书目数据库(bibliographicdatabase)存储二次文献,其检索结果是文献的线索而非原文。如BKSY全文数据库(fulltextdatabase)主要存储一次文献提供原始文献全文数值数据库(numericdatabase)主要存储用数值表达的量化信息WHO的世界卫生统计数据事实数据库(fact

5、database)主要存储三次文献(what、where、when、who、why、how)类信息《中国大百科全书》MarriamWebsterDictionary提供的《大不列颠百科全书》免费查询多媒体/超文本数据库multimedia/hypertextdatabase同时存储声音、图像、文字等的超文本信息。检索者如何让计算机实现自己的检索意图?四、检索提问表达式检索提问表达式=检索词+运算符(一)、检索词数码类2007(年)C19H33NO2HCL(分子式)343.94(分子量)D665.2(分类

6、号)GNGY(基因代码)54-16-089(化学物质登记号)字词类获得性免疫缺陷综合征AIDS刘伟中国行政管理云南大学3一乙酰基一5一羟甲基布尔逻辑符字段限定符位置运算符通配符短语符(二)、运算符questions铁(痕量元素);李铁(人名);铁道医学杂志(刊名);上海铁道医学院,铁路医院(作者地址)……查找作者“黎明”的文章,结果包括了“…黎明”及“黎明…”的文章英语单复数的变异、英美拼法的不同、同义不同性词(词干相同后缀不同);音译外来词中文取词的不同名称运算符逻辑关系举例作用逻辑与AND*限定AA

7、NDB缩小逻辑或OR+等同AORB扩大逻辑非NOT-排斥ANOTB缩小布尔逻辑运算符BooleanOperators逻辑与ABAANDBA*B缩小检索范围,提高专指性。示例糖尿病与高血压AB糖尿病高血压AANDB逻辑或AORBA+BAB扩大检索范围,提高查全率。示例政治、经济、宗教与伦理学的关系ACB(AORBORC)ANDD(A+B+C)*DD政治经济宗教伦理学逻辑非ABANOTBA-B缩小检索范围,提高查准率。示例非共产主义人生观B821.2(人生观、人生哲学中除共产主义人生观外的那一部份)A:人生

8、观、人生哲学B:共产主义人生观AnotBA-B逻辑运算次序布尔逻辑运算次序布尔逻辑的运算就象数学中的四则运算的“先乘除后加减”一样,也有优先级的问题,它的优先级从高到低依次为:非(NOT)→与(AND)→或(OR)当然,括号最优先。因此,括号也称为优先符。优先符可以改变布尔逻辑的正常运算次序。如:信息+情报NOT经济(信息+情报)NOT经济检索结果不同。示例胃炎、胃溃疡、胃肿瘤与幽门螺杆菌的相关性(不要cagA,vagA)(胃炎or胃溃疡o

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。