计算机信息检索概论

计算机信息检索概论

ID:33295647

大小:667.23 KB

页数:57页

时间:2019-02-23

计算机信息检索概论_第1页
计算机信息检索概论_第2页
计算机信息检索概论_第3页
计算机信息检索概论_第4页
计算机信息检索概论_第5页
资源描述:

《计算机信息检索概论》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、计算机信息检索概论信息检索的发展简史♦手工检索:利用各种中西文文献检索工具刊或书进行检索的方式。♦机械检索:指利用穿孔卡片和光电检索系统进行检索的一种信息检索方式,♦计算机检索计算机信息检索的起源♦1946年,世界上第一台计算机诞生♦1954年,美国海军武器试验所IBM701型电子管计算机♦1960年,美国生物科学信息社(BIOSIS)使用计算机编排的《生物学文摘》的“关键词索引”,♦1963年,美国国立医学图书馆建成的医学文献分析和检索系统(MEDLARS)什么是计算机信息检索:♦从文献信息的角度来看,就是将大量的文献资料或数据进行加工

2、处理,按一定的格式存储在磁盘上,建成计算机可读文献资料档,即机读数据库;并利用计算机对这些文献资料档查询所需的文献或数据的检索方式。因此,计算机信息检索系统的构成从广义上讲包括信息存储和信息检索两个方面。一、计算机信息检索的特点项目手工检索计算机检索总体特征手翻、眼看、大脑判断策略、查看、机器匹配标引及索引点检索点较少检索点较多检索时间较慢较快检索要求专业知识、外语知识、专业知识、外语知识、机检索工具知识检系统知识综合效率较低较高不足:♦数据库回溯检索时间相对较短。♦系统的可靠性尚未能持续,各种设备如出现故障将造成检索失败,带来时间和经济

3、上的损失。♦检索的适应性有时较差,当用户有一个明确的信息需求时,利用计算机检索能获得较高的检索质量和效果,但在需求不明朗或含糊不清时,检索效果常常不理想,尤其在互联网上检索时,有时受网络速度和其他原因的影响,检索质量不高。二、计算机信息检索经历的阶段♦(一)脱机检索Off-lineRetrieval♦(二)联机检索Online-Retrieval♦(三)光盘检索CD-ROMSearching♦(四)Internet检索InternetSearching(一)脱机检索(一)脱机检索Off-lineRetrieval♦定义:又称批式检索,是指

4、用户将检索要求送往检索中心,由专职操作计算机的人员进行检索,再将检索结果返回给用户的一种检索方式。♦特点:①批处理可同时进行多项检索(信息存储在磁介质上)♦②检索费用低,无通讯费用,费用由用户平贪♦缺点:①缺乏用户与系统的直接交流,检索要求表达不清,影响检索质量,“一次机会”式的检索♦②时间上的延迟(二)联机检索(二)联机检索OnlineRetrieval♦定义:用户利用计算机终端,通过通讯网络,与主机系统以直接对话方式进行数据互传,从检索系统的数据库中查找出用户所需的情报信息的过程。♦如:Dialog国际联机检索系统♦联机检索系统组成:

5、♦①主机系统:服务器,存有大量数据信息(数据库)♦②通讯系统:电话线、光纤、光缆、卫星、微波♦③检索终端:用户直接使用的终端机器特点:♦①克服了地理上的障碍,“人机对话”方式可使检索者随意更改检索策略,从而达到很高的检全率和检准率②消除了时间上的延迟:分时③保证检索者获得最新、最及时的文献信息♦缺点:♦①检索费用高:如Dialog系统②检索技术较为复杂,难以成为普及型的检索手段(三)光盘检索(三)光盘检索CD-ROMSearching♦光盘:CompactDisc简称CD•定义:一种用激光技术在特制圆盘上记录和再生信息的介质,是一种不同于

6、磁性载体的光学存储器直径4.75英寸重量150g•只读光盘CD-ROM(CompactDisc-ReadOnlyMemory)*写读光盘WORM(WriteOnceReadMany)*可擦写光盘Writable•特点:①存储密度高,容量大:650MB②存取速度快,并可随机存取:③体积小,易于携带,方便复制、保存♦光盘网络:把多个光盘驱动器连接到一台微机上,再将微机连接到网络上,使该网络上的光盘数据库资源为众多用户所共享(四)网络检索(四)网络检索InternetSearching♦Internet上有许多著名的生物医学文献数据库,如万方医

7、药信息系统、CNKI、PubMed、GeneBank、ToxNet等,有的需要付费,有的可以免费检索和利用,这为许多没有经费或条件引进数据库的医院或医学科研单位的人员检索文献提供了极大的方便,而且这些数据库以简单直观的Web检索界面,深受医学专业人员的欢迎。♦网络信息资源类型丰富三、计算机信息检索的基本原理信息存储信息检索原始信息信息需求分析主题分析主题信息要素(特征)信息要素(特征)检索语言著录标引选定转换(主题词表)数据库(记录及提问标识/提问式信息特征标识)(符合数据库)计算机(数据库)类比输出图1-1检索结果1、数据库的建立♦数据

8、库:是一种计算机能阅读和处理的文字型或数值型数据的集合体。数据库文档←记录←字段♦文献数据库的建立从信息源中选择所需文献进行加工,形成文献特征的标识,把这些标识输入计算机,按事先设计好的规则把

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。