欢迎来到天天文库
浏览记录
ID:46972528
大小:5.57 MB
页数:28页
时间:2019-12-02
《课题三计算机信息检索基础理论》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、课题三计算机信息检索基础理论关于计算机检索计算机信息检索的概念计算机检索就是将大量的文献资料或数据进行加工整理,按一定格式存储在机读载体上,建成机读数据库,利用计算机对机读型数据库进行检索的信息检索方式对于信息用户来讲,计算机检索也就是利用电子计算机对机读型的数据库进行检索计算机信息检索程序框图检索课题主题分析选择检索系统选择数据库确定检索点制定检索式计算机处理结果检验结果分析用户YN索引词典原始文献著录标引数据库输出检索结果计算机信息检索特点检索速度快检索途径多更新快资源共享检索更方便灵活检索结果可以直接输出计算机信息检索系统构成硬
2、件设备软件系统检索数据库人力资源计算机检索的发展趋势可视化相对于纯文本,图像的表达方式生动、形象,从多角度揭示主题多样化(1)提供多媒体检索功能(2)多语种检索(3)服务多元化个性化根据用户个人偏好对检索用语种、网站语种进行设置商业化可为全球数量众多的用户提供电子信息的增值服务,网络检索系统已成为新的投资热点检索数据库检索数据库就是在计算机存储设备上,按一定方式存储的相互关联的数据集合检索数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源检索数据库的类型全文数据库存储的是原始文献的全文,如杂
3、志论文、报纸新闻、法院案例等全文检索可直接获取原始资料书目数据库存储的是二次文献,包括文献的外部特征、题录、文摘和主题词等,检索结果是所需文献的线索而非原文许多书目数据库是印刷型文献检索工具的机读版数值数据库主要存储的是数字数据,如各种统计数据、科学实验数据、科学测量数据等事实数据库存储的是用来描述人物、机构、事物等信息的情况、过程、现象的事实数据检索数据库的结构检索数据库由文档构成,文档由记录构成,记录由字段构成,字段由数据单元构成记录是数据库的信息单元,每条记录描述了一个原始信息的外部特征和内部特征,一条记录代表一篇文献字段是比记
4、录更小的单位,是组成记录的数据项目,反映一篇文献的具体特征数据库文档1文档2记录1记录2字段1字段2单元1单元2单元3字段3记录3文档3检索数据库的库文件结构数据库文件其实就是存储于机读磁盘上的、由各项机读数据构成的、横竖对齐的二维表格的集合数据库常用检索字段(途径)TI(Title)篇名(题名)字段AB(Abstract)文摘字段AU(Author)著者字段K(KeyWord)关键词字段CS(CorporateSource)著者机构字段JN(Journal)刊名字段DT(DocumentType)文献类型字段PY(Publicati
5、onYear)出版年字段LA(Language)语种字段CC(Classification)分类号字段计算机信息检索技术布尔逻辑检索截词检索词位置检索字段限定检索一、布尔逻辑检索布尔逻辑检索:是通过布尔逻辑算符,把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以综合表达用户的检索要求的计算机检索手段布尔逻辑检索技术是当今检索理论中最成熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式布尔逻辑运算符与AND或OR非NOT括号()逻辑运算符的优先顺序为:()>NOT>AND>OR布尔逻辑检索表达式逻辑与检索
6、字段=检索词Aand检索词B检索词A和检索词B同时出现在同一条检索记录中逻辑或检索字段=检索词Aor检索词B检索记录中有检索词A或检索词B,包括两词同时出现在同一条记录中逻辑非检索字段=检索词Anot检索词B记录必须包含检索词A但不能含检有索词B;即在含有检索词A的文献中去除含有B检索词的文献括号:改变运算顺序检索字段=(检索词Aand检索词B)not检索词C学术期刊库作者=谭银元and潘应君作者=谭银元or潘应君作者=谭银元not潘应君二、截词检索截词检索的概念就是在检索词的适当位置截断,将检索词的一部分作为检索词干,配合截词符号进
7、行检索,只要检索词和标引词的词干相同即为命中文献,故又称为部分一致检索作用减少检索词的输入量,扩大检索范围,提高检索效率可避免漏检注意事项使用截词检索时,应注意词干不宜太短,以避免检出过多与原检索词不相关的文献记录常用截词符号“?”和“*”;教材以“?”作为截词符分类按截词位置后截断前截断中间截断按截词方式有限截词无限截词1、后截断检索截去检索词的尾部,是词的前方一致比较,也称前方一致检索用“system?”(“?”为后截断符号)将会把含有“system”、“systems”等词的记录检索出来用“生产?”将会把含有“生产”、“生产力”
8、、“生产工具”、“生产方式”等词的记录检索出来2、前截词检索截去检索词的前部,是词的后方一致比较,也称后方一致检索用“?英语考试”,能够检索出含有“四级英语考试”、“六级英语考试”、“研究生英语考试”等词的记录用“?li
此文档下载收益归作者所有