信息检索中排序优化方法研究.pdf

信息检索中排序优化方法研究.pdf

ID:34627379

大小:1.38 MB

页数:62页

时间:2019-03-08

信息检索中排序优化方法研究.pdf_第1页
信息检索中排序优化方法研究.pdf_第2页
信息检索中排序优化方法研究.pdf_第3页
信息检索中排序优化方法研究.pdf_第4页
信息检索中排序优化方法研究.pdf_第5页
资源描述:

《信息检索中排序优化方法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、密级:中图分类号:TP311硕士学位论文信息检索中排序优化方法研究研究生:赵文玉导师:周栋学科:软件工程研究方向:信息检索2018年05月AThesisSubmittedfortheDegreeofMasterResearchonInformationRetrievalRankingOptimizationMethodsCandidate:ZhaoWenyuSupervisorandRank:ZhouDong(Professor)信息检索中排序优化方法研究学位类型学术型学位作者姓名赵文玉作者学号15010502001学科

2、(专业学位类别)软件工程研究方向(专业领域)信息检索导师姓名及职称周栋(教授)实践导师姓名及职称所在学院计算机科学与工程学院论文提交日期2018年5月学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学

3、位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期:年月日导师签名:日期:年月日摘要近年来,随着Internet的蓬勃发展,Web上的数据信息资源一直呈爆炸式增长,用户从海量的数据中获取信息的难度也在不断地增加。信息检索技术的出现和快速发展,使得搜索引擎成为了用户查找信息资源的主要方式。在信息检索的过程中,由

4、于用户提交的查询词可能过短或过长,导致查询词无法准确地表达用户的查询意图,从而导致查询词与Web文档的词汇不匹配问题,无法检索到所需的信息。此外,在大多数情况下,用户一般只对排名在检索结果列表顶端的搜索结果感兴趣,而检索系统返回的这一部分结果中包含大量的与用户信息需求不相关的结果,只有少部分能够满足用户的要求。因此,如何提高信息检索系统中顶端结果的准确率以及用户的满意度一直是当前的研究热点。为解决这些问题,研究者们通常采用两种方法:查询结果重排序和查询扩展。查询扩展方法是通过挖掘与用户信息需求相关的词项,对原始的查询词进

5、行扩展,用扩展后的查询词进行第二轮检索。查询结果重排序方法则在第一轮检索结果的基础之上,对结果列表中的文档进行重新排序。从实用性的角度来说,查询结果重排序方法更受欢迎。现有的查询结果重排序的方法主要考虑文档与文档之间的关系,利用其建立文档关系图,使用基于图的中心节点、半监督学习等技术,重新计算文档与查询词之间的相似度,达到查询结果列表中文档重排序的目的。然而这些方法都只考虑了文档之间的关系,存在一定的局限性。从另一方面来说,将查询结果重排序与查询扩展相结合的研究亦不多。本文在前人的研究基础上,主要做了以下的两个方面的工作

6、:1.本文提出了一种基于多重关系的查询结果重排序方法。该方法在考虑文档与文档关系的基础之上,还考虑了查询结果中排名靠前文档中关键词项与关键词项关系,以及文档与排名靠前文档中关键词项的关系。然后利用正则化框架融合这三种关系,在第一轮检索结果的基础之上,进行查询结果重排序。在信息检索标准评测数据集上的实验结果证明了基于多重关系的查询结果重排序方法比只考虑一种关系的方法更能够显著提高准确率。2.本文在查询结果重排序的基础之上,结合了查询扩展,提出了一种检索排序优化方法。该方法首先通过正则化框架融合文档与文档之间的关系,在第一轮

7、检索结果的基础之上,进行检索结果列表文档重排序;然后基于重排序后结果中排名靠前文档来构建扩展词集合,进而从构建的扩展词集合中选取候选扩展词对原始查询词进行扩展。在真实数据集上的实验结果表明,该方法能够有效提高信息检索系统中排名顶端结果的准确率,从而提高用户的满意度。关键词:信息检索;查询结果重排序技术;查询扩展技术;正则化框架;扩展词集合iiiAbstractRecently,asthedramaticdevelopmentofInternet,thedataandinformationresourcesontheWeb

8、showanexplosiveincreasetrend,it'sdifficultforuserstoquicklysearchtherelevantresultsfromenormousquantityofWebdata.AstheadventanddevelopmentoftechnologiesaboutIn

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。