欢迎来到天天文库
浏览记录
ID:36631540
大小:229.34 KB
页数:6页
时间:2019-05-13
《搜索引擎主要性能评价指标体系研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第23卷第1期2004年2月情报February,2004搜索引擎主要性能评价指标体系研究)凤元杰刘正春王坚毅(嘉兴学院图书馆,浙江嘉兴314001)摘要本文探讨了在互联网络环境下的信息检索传统评价指标体系的缺陷和建立搜索引擎主要性能评价指标体系的若干原则,提出了“相对查全率”和“相对查准率”的概念和计算方法,初步建立了搜索引擎主要性能评价指标体系。关键词搜索引擎信息检索评价检索工具ResearchonInformationRetrievalEvaluationMeasureSystemforSearchEngineFunctio
2、nsFengYuanjie.LiuZhengchunandWangJianyi(6m,yofJiax/ngCo/~se,z)I撕J/ax/ng314001)AbstractThisplIperexplorestheinsuficiencyoftraditionalinformationretrievalevaluationmeasIlresystemencounteredwithinthenetenvironmentandsetsupsomerulesfortheretrievalevaluationmoMisul~systemf
3、orwebsearchtools.TheIperalsointroducestheconcepts“therelevancycategory”and“firstXprecision”andtheirformulaacquired.Theretrievalevaluationmea.stl/~systemforwebsearchtools,therefore,hasbeensetuptentatively.Keywordssearchengine,informationretrievalevaluationme目u虬lIesyste
4、m,websearchtools.相关性判断的工作量非常大,这就使得传统的“查准1信息检索传统评价指标体系的缺陷率”判断不具有现实可操作性;“响应时间”不能得到一致的、准确的数据,同一课题,在不同的时间段或从1994年4月,web上第一个搜索引擎Web—不同的地点,“响应时间”都会不同,这是因为它受到Crawler一问世到今日,网上搜索引擎已有数千种;同通讯设备、网络的拥挤程度等外部因素的影响所致。时,伴随着搜索引擎的广泛应用,人们对搜索引擎信息检索性能的比较与研究也从1995年开始逐渐重2建立搜索引擎主要性能评价视。但由于lnt
5、emet网络上存储的信息浩如烟海,且指标体系的若干原则始终处于动态变化之中,这使得大多数传统的重要信息检索指标难以量化,如:“查全率”无法计量,这正因为信息检索传统的评价指标体系存在着比是因为整个互联网上相关文献信息总量处于动态变较大的缺陷,难以对现代网络信息检察工具——搜化之中难以计算;“查准率”也难以实际操作,这是因索引擎进行客观、科学的评价,由此有必要对传统信为对大多数课题来说,检察结果的返回数都比较大,息检索评价指标体系进行扬弃;保留其合理的成分,收稿日期:2003年3月24日作者简介:凤元杰,男,北京大学信息管理硕士。1
6、)本文为浙江省教育厅课题(浙教高科[20021161号)论文之一情报学报克服其严重的缺陷,从而建立一套科学、合理、有效基础,由此我们把它摆在评价指标的第一部分来考的搜索引擎评价指标体系。要建立一套搜索引擎主虑。搜索引擎索引库的评价指标应该包括索引标引要性能的评价指标体系,首先就必须探讨建立搜索数量、标引的文件种类、标引深度和更新频率等方引擎评价指标体系的原则,以保证我们建立的搜索面。由于索引标弓l数量我们难以检测,可以通过本引擎评价指标体系有一个客观、统一的基础。我们文后面提到的“相关查全率”来间接反映,故这里把认为搜索引擎评价指
7、标体系的建立应该符合以下三它剔除。索引标引深度内含几方面的内容,如全面原则:科学、合理、有效。索引或部分索引、是否考虑超文本的不同标记所表1.科学:就是指新建立的搜索引擎评价指标体示的不同含义和是否收集页面中的超链接等,而且系能客观、真实、全面地反映搜索引擎的主要性能及索引数据库标引的深度直接影响检索效果,所以我其同内在联系。们把它细分为三方面。见表1。2.合理:就是指搜索引擎评价指标体系是对传2.搜索引擎检索功能的相关指标统的信息检索评价指标体系的扬弃,继承信息检索搜索引擎检索功能的评价指标主要包括:基本传统评价指标体系中的有用
8、部分,摈弃信息检索传检索、高级检索、目录式浏览检索和其他功能检索。统评价指标中存在严重缺陷的部分,增加新的适合见表2。互联网上信息检索评价需求的内容。使搜索引擎评3.搜索引擎检索效果的相关指标价指标体系既继承传统评价指标体系,又符合当代1)相对查全
此文档下载收益归作者所有