搜索引擎评价指标特性的研究

搜索引擎评价指标特性的研究

ID:36463105

大小:2.43 MB

页数:59页

时间:2019-05-10

搜索引擎评价指标特性的研究_第1页
搜索引擎评价指标特性的研究_第2页
搜索引擎评价指标特性的研究_第3页
搜索引擎评价指标特性的研究_第4页
搜索引擎评价指标特性的研究_第5页
资源描述:

《搜索引擎评价指标特性的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号壁圣窆!UDC螋密级坌五编号'.10299S11080—65江蒜大擎硕士学位论文搜索引擎评价指标特性的研究ResearchofCharacteristicsofSearchEngineMetrics作者姓名道延查指导教!J币旌丝壶申请学位级别亟±学科(专业)j土篡扭应届撞苤论文提交日期2Q!垒生§县论文答辩日期2Q!垒生鱼且学位授予单位和日期江菱太堂2Q!垒生鱼旦答辩委员会主席评阅人独创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已注明引用的

2、内容以外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果,也不包含为获得江苏大学或其他教育机构的学位或证书而使用过的材料。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。靴敝储鹤:聪月7日学位论文版权使用授权书江苏大学、中国科学技术信息研究所、国家图书馆、中国学术期刊(光盘版)电子杂志社有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致,允许论文被查阅和借

3、阅,同时授权中国科学技术信息研究所将本论文编入《中国学位论文全文数据库》并向社会提供查询,授权中国学术期刊(光盘版)电子杂志社将本论文编入《中国优秀博硕士学位论文全文数据库》并向社会提供查询。论文的公布(包括刊登)授权江苏大学研究生处办理。本学位论文属于不保密口。学位论文作者签名:≯l牛年《只指导教师)()忙年江苏大学硕士论文摘要对搜索引擎的检索质量进行评价是信息检索领域的一个重要方面,因此,人们提出了许多搜索引擎评价指标。各种评价指标本身各有特色,如有的评价指标稳定性较好,但敏感性较差;另一些评价

4、指标则反之。如何得到综合特性最优的评价指标,从而对搜索引擎的检索质量进行准确、全面、令人信服的评价,是信息检索领域面临的一个重要的难题,为此,需要准确、可靠的评估方法。本文提出了基于t检验的评估方法,同时使用该方法对文档二值相关和多值相关两种情形下的五种常用评价指标进行了实验研究,它们是MAP(meanaverageprecision,平均查准率)、P@10(precisionat10documentlevel,前10个文档的查准率)、RP(recall.1evelprecision,可查全水平查准

5、率)、RR(reciprocalranking,第一位相关文档的倒数)、NDCG(normalizeddiscountedcumulativegain,规范化带减量的累积增长)。研究结果表明,两种情形下评价指标NDCG的综合特性都是最好的,其次是MAP,然后是RP和P@10,综合特性最差的评价指标都是RR。此外,本文还提出了评价指标困难度指数的概念,它可以有效地帮助评价人员对使用不同评价指标得到的不同搜索引擎之间的检索质量进行快速地比较,研究结果表明,评价指标RR的困难度指数最小,其次是NDCG、P

6、@10、RP,困难度指数最大的评价指标是MAP。通过本文的研究和讨论,基于t检验的评估方法可以作为评估搜索引擎评价指标综合特性的有效方法。它使得计算过程更简单、结果更可靠,并且可以量化比较的结果。该方法不仅能应用于在文档二值相关的情形下的评价指标,也能应用于文档多值相关的情形下的评价指标。另外,困难度指数概念的提出可以帮助信息检索评价人员节省大量的评价时间,提高评价的效率。关键词:搜索引擎,评价指标,评价指标特性,t检验江苏大学硕士论文AbstractRetrievalevaluationisalw

7、aysanimportantaspectininforillationretrievalandtherearemanymetricsproposed.Eachmetrichasitsownuniquecharacteristics,suchasbetterstabilitybutpoorsensitivityandviceversa.Howtogetaoptimalmetricincomprehensivecharacteristicstoretrieveaccurate、comprehensive

8、andcompellingassessmentiSanimportantproblemfacingthefieldofinformationretrieval.Tosolvethisproblem,accurateandreliableassessmentmethodisneeded.嘣Spaperpresentsanassessmentmethodbasedont-testandusingthemethodstudyfivecommonlyusedsearcheng

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。