欢迎来到天天文库
浏览记录
ID:24350495
大小:52.00 KB
页数:4页
时间:2018-11-13
《基于混合关系模型的查询扩展》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于混合关系模型的查询扩展随着因特X规模的不断增大,用户需要更加完善的信息检索工具。本文的研究范围主要是信息检索技术中的查询扩展算法,我们重点关注利用混合关系模型进行查询扩展的效果。关键词:信息检索;查询扩展;混合关系模型一、引言 在当前的信息检索模型与系统中,词不匹配成为影响信息检索效果的重要原因之一。解决这一问题,目前多采用查询扩展技术。查询扩展指在检索前,先根据扩展词表自动把用户查询关键词的同义、近义词扩展进来形成新的查询,再提交检索。其核心是从词的概念层次来认识和扩充用户的检索请求,以提高检
2、索的查全率。 本文主要探讨混合关系模型进行查询扩展的效果。本文实验中使用的查询引擎是Indri。使用文本集为AQUAINT文档集,该文档集包含1033461个文档。二、本文使用模型 本文当中使用Metzler的依赖模型来获得词的临近信息,它可以提高“词袋”模型下的查询精度。所谓“词袋”模型,就是文档的表示方法不显示词与词的位置关系和语义联系,只反映文档中包含什么词。下面以一个查询为例子,如查询“arrestsbombingl:namespaceprefix=ons="urn:schemas-mic
3、rosoft-:office:office"/>#bingargin:0cm0cm0pt90pt;mso-list:l0level2lfo1;tab-stops:list90.0pt;">0.1#bine(#1(arrestsbombing)#1(bombingargin:0cm0cm0pt;">#1(arrestsbombingargin:0cm0cm0pt;">0.1#bine(#ubing)#uargin:0cm0cm0pt;">#ubingargin:0cm0cm0pt;">#ubingT和i
4、ndriRdmD方法只使用依赖模型,两者的不同之处在于一个是对标题文档集(T)一个是对摘要文档集(D)。而indriRdmeT和indriRdmeD则既使用依赖模型又使用混合相关模型。其中P(bignemT方法也是采用两种模型,只不过P(bigneargin:0cm0cm0pt;mso-char-indent-count:1.5;">RunIDMAPGMAPAreaindriRdmT0.21590.13541.4250indriRdmeT0.32040.19672.3777IndriRdmmT0.33
5、230.20612.6330 表2在摘要文档集上的实验结果RunIDMAPGMAPAreaindriRdmD0.19960.10150.9016indriRdmeD0.28180.16111.9899 通过实验发现与单独使用依赖模型相比,使用混合模式的实验效果有大幅度地提高。这也证明了该方法的可行性。而且通过实验可以看出,P(bigneodels.InProceedingsofSIGIR2001,pages120-127,2001.
此文档下载收益归作者所有