文献检索效率的影响因素及其改善方法2

文献检索效率的影响因素及其改善方法2

ID:12819791

大小:27.00 KB

页数:3页

时间:2018-07-19

文献检索效率的影响因素及其改善方法2_第1页
文献检索效率的影响因素及其改善方法2_第2页
文献检索效率的影响因素及其改善方法2_第3页
资源描述:

《文献检索效率的影响因素及其改善方法2》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、文献检索效率的影响因素及其改善方法文献检索的目的是全面、准确地为用户提供所需文献。但是,从用户角度来看,在检出的文献中可能会夹杂着一些不符合提问要求的文献(即误检文献);反之,在未检出的文献中也可能存在着少量符合提问要求的文献(即漏检文献)。由于用户的看法和需要不同,对检出文献是否满足要求的相关性(即实用性)评价也可能不同。因此,文献的相关性评价在某种程度上带有主观性。尽管如此。仍可作为评价文献检索效率的基础。所谓检索效率简单地说,是指检索系统提供库存相关文献、满足用户的程度。文献检索效率一般按照以下

2、标准来评价:¹文献库收录范围;º查全率和查准率;»响应时间;¼费用等。其中查全率和查准率是重要的也是最常采用的技术标准。在现代的文献检索系统中,查全率一般为60一70%,查准率为40一50%。由于查全率和查准率之间存在着互逆关系,如果进一步提高查全率(超过70%),只能靠降低查准率来达到,反之亦然。因此,对任何一个文献检索系统来说,要求得到查全率和查准率均为1的答案,实际上是不可能的,必须按照用户的要求选择最佳的查全率和查准率的比例关系。影响检索效率的因素实践表明,影响检索效率的因素是多方面的,主要与

3、文献标引的质量、主题词表的质量和检索式编写等因素有关。(一)标引质量标引指的是对文献或提问进行主题分析、给出检索标识(主题词、分类号等)的过程。其目的是按照给定的检索标识组织各种检索工具(例如,目录、索引或机读文档等)。因此,文献标引质量不仅与组织检索工具有关,而且是影响检索效率的主要因素之一。1.衡量标引质量的标准标引质量可以理解为标引文献或提问时给出主题词的正确性和全面性,表现在文献的引得深度。按照兰卡斯特的定义“引得深度是指标引的网罗性和主题词的专指性”的总称,据1966一67年期间使用MEDL

4、ARS系统所得到的文献检索效率表明,漏检相关文献数的20%是由于引得深度不够造成的。因此,我们可以将标引的网罗性和主题词的专指性做为评价标引质量的标准。(1)标引的网罗性是指标引时揭示文献主题内容的广度而言。如果对文献内容分析得愈深透,标引得愈全面,那么检索时相关主题的文献就能都检索出来,因而查全率较高。例如,查找题为“计算机检索软件设计”方面的文献,经过文献主题分析后选出计算机,情报检索、程序设计三个词。从标引的广度或包含检索角度来看,还应补加:程序系统和应用程序二个词。另一方面,如果标引的网罗性太

5、高,那么检出的文献中就会渗杂着较多的非相关文献,查准率就会降低。因此,标引网罗性是影响查全率的重要因素之一。(2)主题词的专指性。主题词的专指性是指其表达主题的深度而言。标引时,如果选用专指性强的主题词愈多,则检索时检出的文献针对性愈强,查准率就愈高。仍以“计算机检索软件设计”问题为例,标引时除选用“计算机”一词之外,还应选用“电子计算机”一词。使用前一词可以实现包含检索,查全率较高,使用后一词可以实现特性检索,查准率较高。因此,主题词的专指性影响查准率的重要因素之一。怎样掌握标引的网罗性和主题词的专

6、指性,以达到所需引得深度,应根据检索系统任务和数据库特点而定。2。标弓!质量的影响因素由于人们专业知识和工作经历不同,在标引的网罗性和主题词专指性方面,很难达到标引的一致性,同时也很难避免产生错误。所谓标引的一致性是指几个人同时标引一篇文献或一个人在不同时间内标引同一篇文献所选用主题词的一致程度。(1)网罗性不当例如,对文献题为“空气、土壤、对流层中氢一226的积累”标引时,如果不选用表示环境的主题词“空气、土壤、对流层”,而只选用表示氢移动的“降水”一词,则网罗性很低,检索时必定漏检相关文献,查全率

7、降低。(2)用词不当、漏掉重要词例如,对文献题为“调整加速器中气体流速阀的性能”标引时,只选用“阀”作标引词,而未选用作为使用对象的“加速器”,,76,或者选用“气体”、“流体”之类的不适当的词,而漏掉“气体流、流量”之类的重要i司,检索时就会产生漏检和误检,结果降低查全率和查准率。当然,标引时人们还会做出其他错误,影响标引质量。(二)主题词表质量主题词表的质量主要表现在词表结构和词汇特点方面。词表结构由款目词、词间关系及其有关数据组成。款目词按其字顺排歹lJ,以便于检索。词间参照关系一般分为同义关系

8、、等级关系和相关关系。同义关系的作用是当某一概念采用不同词时用来确定采用的词。借以提高查准率,等级关系和相关关系的作用是推荐主题词、扩大标引范围,借以提高查全率。因此,参照关系在一定程度上决定主题词表的功能。冠恩和达古里阿克调查《美国国会图书馆标题表》(L七)《医学索引标题表》(人悦SH)和《美国武装部队技术情报局主题词表》(ASTIA)之后发现,参照性愈强,检索效率愈高。反之,如果完全没有参照关系,或者参照关系不完备,检索效率就愈低。他们对这三种表做了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。