欢迎来到天天文库
浏览记录
ID:45658288
大小:4.27 MB
页数:48页
时间:2019-11-15
《《讲中文数据库检索》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、中文数据库检索一、检索技术二、中文数据库检索一、检索技术(计算机检索系统功能)计算机信息检索的基本检索技术(计算机信息检索系统功能)主要有逻辑检索、截词检索、限定检索。一)逻辑检索逻辑检索的基础是布尔逻辑算符。布尔逻辑算符即规定检索词之间的逻辑关系的算符。包括:逻辑“或”、逻辑“与”、逻辑“非”。逻辑“或”(OR)运算符:也可用“+”代替,是用来组配具有同义或同族概念的词。如:检索提问式:“AORB”或“A+B”其含义是数据库记录中任何一条记录,只要含有“A”或“B”中任何一个检索词即为命中的文献(如下图阴影部分)。“OR”算符的基本作用是扩大检索范围,增加命中文献量,提高文献的查全率。如:“
2、微机+电脑+PC机”、“微机or电脑orPC机”逻辑“与”(AND)运算符:也可用“*”代替,用来组配不同检索概念,是一种概念相交和限定关系的组配。例如:“AANDB”或“A*B”,其含义是检出的记录中必须同时含有“A”和“B”两个检索项(如图中阴影部分所示)。“AND”算符的基本作用是对检索词加以限定,逐步缩小检索范围,提高检索结果的查准率。例如,检索“计算机在图书馆中的应用”方面的文献,其提问式可写成:“computer*library”或“computerANDlibrary”③逻辑“非”(NOT)运算符:也可用“—”代替,“NOT”算符是排除含有某些词的记录,其逻辑提问表达式为“ANO
3、TB”或“A-B”,即检出的记录中只能含有“NOT”算符前的检索词A,但不能同时含有“NOT”后的检索词B(如图中阴影部分)。“NOT”算符的基本作用是缩小检索范围,但并不一定能提高文献命中的准确性,一般只起到减少文献输出量的作用。在联机检索中可降低检索费用。例如:“计算机NOT微机”应注意,由于“NOT”算符有排除掉相关文献的可能,因此,在实际检索中应慎重使用。二)、截词检索截词检索就是使计算机保留检索词中的相同词干部分,允许检索词有一定范围的变化,这种检索功能可以减少输入步骤,简化检索程序,获得较高的查全率。尤其是英语的单词词尾变化较多,为避免输入过多的词易出现失误或漏检,经常要使用截词检
4、索。不同的检索系统有其不同的截词符(如EICompendex数据库的截词符在DIALOG系统用“?”,而EICompendexWeb数据库的截词符则为“*”,故应注意不同系统中截词符的形式),但其功能基本相同。截词的用法主要有两种形式:“限制截词”和“非限制截词”。截词包括后截、中截、前截等。不同检索系统截词符各有规定,常用有:?、*、!、$在DIALOG国际联机检索系统中,用?作为截词符,主要包括下列情形:符号 意义 后截实例中截实例?后截断(非限制截词)computer?;中截一字符wom?n??后截一字符computer????后、中截二字符act??;encyclop??di
5、a???后、中截三字符computat???computer?会自动检索出下列等词Computer、computers、computerise、computerize、computerisation……wom?n自动检索出women、womancomputer??仅自动检索出Computer、computers,而词尾其它变化的词不会出现computat???会自动检索出Computer、computers、computerise、computerize,而对于computerisation……等词尾字符变化超出3个以上的词不会出现;注释:EI为美国的《工程索引》EICOMPENDEX数据库:
6、美国的《工程索引》光盘版。EICompendexWeb数据库;美国的《工程索引》的网络版。Dialog系统是目前世界上最大的国际联机情报检索系统,覆盖各行业的900多个数据库,信息总量约15TB,共有14亿条记录。在Dialog系统资源中,各种类型的商业性数据库多达400个左右,占有举足轻重的地位。存储的文献型和非文献型记录占世界各检索系统数据库文献总量的一半以上。Dialog系统在全球六个大洲100多个国家保有两万五千位客户,是全球最大的专业信息供应商。文档的专业范围涉及综合性学科、自然科学、应用科学和工艺学、社会科学和人文科学、商业经济和时事报导等诸多领域。利用DIALOG系统,可进行项目
7、查新、文献调研、课题立项、申报专利、了解市场动态和竞争对手、新产品开发、公司的背景情况、经济预测等等信息。三)、限制检索(1)字段限制检索字段限制检索是计算机检索常用的一种检索形式,通常情况下检索系统在所有基本字段中进行检索,不限定字段。如果希望检索词在某些字段(如文献的题目或者叙词)中出现,就需要用相应的字段限制。字段限制适用于在已有一定数量输出记录的基础上,通过限定字段的方法,减少输出篇数,提
此文档下载收益归作者所有