检索结果隐式多样化排序方法研究

检索结果隐式多样化排序方法研究

ID:35085959

大小:2.41 MB

页数:62页

时间:2019-03-17

检索结果隐式多样化排序方法研究_第1页
检索结果隐式多样化排序方法研究_第2页
检索结果隐式多样化排序方法研究_第3页
检索结果隐式多样化排序方法研究_第4页
检索结果隐式多样化排序方法研究_第5页
资源描述:

《检索结果隐式多样化排序方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号TP311.1密级公开.UDC004.4编号10299z1308029.硕士学位论文检索结果隐式多样化排序方法研究ResearchonImplicitMethodsinSearchResultDiversification指导教师吴胜利教授.作者姓名邬艳艳.申请学位级别专业硕士专业名称计算机技术论文提交日期2016年4月论文答辩日期2016年6月学位授予单位和日期江苏大学.答辩委员会主席张建明.评阅人__________学位论文版权使用授权书江苏大学、中国科学技术信息研究所、国家图书馆、中国学术期刊(光盘版)电

2、子杂志社有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致,允许论文被查阅和借阅,同时授权中国科学技术信息研究所将本论文编入《中国学位论文全文数据库》并向社会提供查询,授权中国学术期刊(光盘版)电子杂志社将本论文编入《中国优秀博硕士学位论文全文数据库》并向社会提供查询。论文的公布(包括刊登)授权江苏大学研究生处办理。本学位论文属于不保密□。学位论文作者签名:指导教师签名:年月日年月日独创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指

3、导下,独立进行研究工作所取得的成果。除文中已注明引用的内容以外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日江苏大学硕士学位论文摘要随着科技的不断发展,人们对信息检索的要求越来越高。通常情况下,用户通过提交的查询关键词来获得想要的信息,而传统的检索系统只是根据文档与查询的匹配度返回结果。关键词查询作为用户信息需求经常是模糊的、具有多义的,即使是相同的查询,不同用户感兴趣

4、的方面也可能不一致,所以传统检索系统已经很难满足用户的多样化信息需求,这使得研究者们逐步意识到信息检索多样化的必要性。对于一给定查询,信息检索系统应该尽可能给出覆盖多方面的结果,来满足用户潜在的不同信息需求。现有支持多样性的检索系统通常采用两阶段处理的方式。第一阶段与传统信息检索系统相同,排名时只考虑文档的相关性。第二阶段在第一阶段的基础上对文档进行多样化排序以提升多样性。目前,信息检索结果多样化排序方法有多种,主要可以归纳为两类:显式方法和隐式方法。显式方法是假定可通过一些外部资源了解到查询的更多信息。而隐式方法则

5、不依赖外部资源提供的额外信息,只考虑检索结果中的文档本身。本文主要是对隐式方法相关的方面进行研究,以往的研究更多的是关注某个方法本身的性能,而多种方法孰优孰劣及各自的适用环境并不是很明确,且关于已提出方法的性能比较研究甚少。对于一个支持结果多样化的检索系统而言,选择哪种重排算法进行结果多样化是值得研究的。本文的主要工作如下:(1)分析比较信息检索结果多样化中经典隐式多样化算法的性能。分析的经典隐式多样化算法有最大边际相关度(MMR)法、相对熵(KL)法、现代投资组合理论(MPT)、稀疏空间选择多样化(SSSD)、量子

6、概率排序原则(QPRP)以及最大和分布(MSD)。通过实验比较六个隐式多样化算法的性能,并采用多样化的评价指标对实验的结果进行评价。(2)提出基于贪心局部搜索下的稀疏空间选择多样化算法,即GLSS算法(SparsespatialselectiondiversificationbasedonGreedyLocalSearch)。该算法是把稀疏空间选择多样化方法来检索前k文档的问题当作运筹学中基础设施位置问题来分析,并使用贪婪局部搜索方式选取满足用户需求的前k个文档。通过实验I隐式多样化方法的研究与分析比较了GLSS算法

7、、SSSD方法、量子概率排序原则(QPRP)和基于贪心局部搜索下的量子概率排序原则(QPRP-GLS)的性能,实验结果表明算法GLSS在多样化评价指标上表现最好。关键词:检索结果多样化,隐式重排序,稀疏空间选择,局部贪心搜索II江苏大学硕士学位论文ABSTRACTWiththecontinuousdevelopmentofscienceandtechnology,peopledependoninformationretrievalsystemsmoreheavily.Typically,userssubmitthei

8、rqueriestogettheinformationthattheywant.Atraditionalretrievalsystemreturnstheresultsbasedontheirmatchingwiththequery.However,theextensiveuseofWebsearchengineinrecentyearsmak

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。