欢迎来到天天文库
浏览记录
ID:37417219
大小:5.15 MB
页数:64页
时间:2019-05-23
《信息检索中的查询扩展算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、江苏大学硕士学位论文信息检索中的查询扩展算法研究姓名:李大高申请学位级别:硕士专业:模式识别与智能系统指导教师:程显毅20080606江苏大学硕士学位论文摘要随着互联网技术的迅速发展,W曲信息J下以指数级的速度增长,如何从这些海量的信息中检索出所需要的信息已成为一个非常重要的研究课题。由于用户查询用词与文档关键词不匹配,传统信息检索的结果并不理想,难以满足用户的查询需求。因此,研究信息检索中的查询扩展技术,通过对用户的初始查询进行扩展以有效地解决“词不匹配”问题,具有重要的理论意义和一定的实用价值。本文的主要工作包括:(1)介绍了课题的研究背景,包括信息检索的概念、
2、性能评价标准、检索模型等,综述了查询扩展的相关知识。(2)针对当前基于关联规则的查询扩展算法未考虑关键词项在文档数据库中的不同文档记录中具有不同权重的缺点,首先提出了一种面向查询扩展的完全加权关联规则挖掘算法‘An触1.we;i曲ted舡sociationRulesM.miIlg筒goritllInforQlleryExpansion,简称筒MAR算法)。该算法充分考虑了关键词项在文档数据库中的不同文档记录中具有不同的权重,利用BM25检索模型对关键词赋以权重,引入完全加权的项权值,并采用4种剪枝策略,实验结果表明该算法能极大地提高挖掘的效率。然后提出了一种基于筒配
3、蛆算法的查询扩展算法(AQue珂Exp锄sion~gori恤nBa∞don筒聊岖,简称筒ⅣARQE算法.)。该算法利用筒聊岖算法对初始查询结果集中的前Ⅳ篇文档进行完全加权关联规则挖掘,构建规则库,并从规则库中选取完全加权置信度最大的K个词作为扩展词进行查询扩展。实验表明则忪RQE算法能显著提高信息检索的性能。(3)针对基于自动相关反馈的查询扩展算法(AQue珂Expallsion赳90ritllInB弱edonAutomaticRelev锄ceFeedback,简称舢心QE算法1中存在的“查询漂移’’问题,提出了一种基于K-meaIls算法的查询扩展算法(AQuer
4、yEXpansion础gorimmBasedonK-mea硒,简称KQE算法)。该算法利用K-means算法对初始查询结果集进行重新排序,提高前Ⅳ篇文档中相关文档的比例,实验结果表明该算法能够有效地抑制“查询漂移"。(.4)结合筒聊恨QE算法和KQE算法,提出了一种基于关联规则和聚类算法的查询扩展算法(AQ!lleryExp孤sion砧goritl皿BascdonA;SodationRllles锄dCluster~gori廿lIn,简称ACQE算法)。该算法首先对初始查询结果集进行重新排序,然后利用筒M根算法对排序后的结果集中的前Ⅳ篇文档进行完全加权关联规则挖掘,选
5、取扩展词进行查询扩展。(5)在CIRB030中文测试集上进行实验,对姗E算法与本文提出的三种查询扩展算法(AwARQE算法、KQE算法、ACQE算法)进行了性能分析与比较。江苏大学硕士学位论文实验结果表明:筒嗍E算法、KQE算法、ACQE算法较删E算法在查准率、平均准确率等方面均有明显改善,能显著地提高信息检索的性能。关键词:查询扩展,筒MAR,筒配~RQE,KQE,ACQE,信息检索Ⅱ江苏大学硕士学位论文晰thme均piddevelopmentoftlleIntemet,mei疵衄ationof恤W曲is蛐expone瓶ally.Howtogetthe北ededi
6、ll】fo肌ation舶m雠shuge埘fomationh硒bec0IneaVeryiIIlponantquestion.Ikcauseofthemismatc:hofmellser,sqllcrywords肌dtI蟛docIlment’skeywordsmeresultoftheⅡaditionalretrievalisIlotsatisfactory.Sotllrou曲merese甜Choftlleque巧expa璐iontoexpandthequcryiIlordert0resolVemeproblemof‘飞帕rdInismatch”iswortllwile
7、bothontheoryandpractj豳;.rnlemajofcon‘tentofmethesisisasfoll∞瞪:(1)Introducesmereseafchb础gro岫d,iIldud吨medefiIlition0f龇iI怕nnationretrieval,pe哟吼觚cecriterion,retrievalmodel,觚ds啪suptl】屺relev孤tlmowledgeofque巧expaIlsioll.(2)PoiIltsoutnlesho胁miI培softllepresentqueryexp柚sionalgori岫sthatb勰cdon嬲s
此文档下载收益归作者所有