个性化信息检索中的相关反馈技术研究

个性化信息检索中的相关反馈技术研究

ID:24693111

大小:76.43 KB

页数:11页

时间:2018-11-09

个性化信息检索中的相关反馈技术研究_第1页
个性化信息检索中的相关反馈技术研究_第2页
个性化信息检索中的相关反馈技术研究_第3页
个性化信息检索中的相关反馈技术研究_第4页
个性化信息检索中的相关反馈技术研究_第5页
资源描述:

《个性化信息检索中的相关反馈技术研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、个性化信息检索中的相关反馈技术研究[摘要]面对目前用户高效准确而又个性的信息需求,考虑在个性化的信息检索中运用相关反馈技术。从介绍相关反馈的研究现状及基本思想出发,在深入分析相关反馈的各种实现策略以及在不同系统中设计的差别后,提出完整的相关反馈技术和个性化信息检索结合的模型,最后讨论引入数据融合的思想来进一步改善反馈效果,以期实现检索系统性能的有效提高。[关键词]相关反馈个性化信息检索查询式修正[分类号]TP391当前随着社会信息化程度的不断提高,利用现有的检索系统快速找到所需的有用信息越来越困难,一方面是因为大量

2、信息资源分布式存放并且融合了复杂文本、图像、声音等非结构化信息,信息量猛增;另一方面是由于用户提交的查询仅仅只能描述出模糊的信息需求,往往要花费大量的时间和精力进行人工分析和判断。为此,相关反馈技术被应用其中,检索效果得到提高,但是,这种类型的相关反馈并没有针对性,所以反馈的结果会出现偏差,有必要根据信息检索者的搜索行为,并迎合他们的具体需求,也就是在了解他们偏好的基础上更有效地实施相关反馈,因此,本文在深入分析了相关反馈应用中一些关键问题后,提出其与个性化信息检索的结合模型。2相关反馈的研究现状及基本思想国内外相

3、关反馈研究已有三四十年的历史,并针对布尔模型、向量空间模型、概率模型等不同的信息检索模型进行了非常广泛的相关反馈技术研宄。有一些系统已经利用相关反馈来改善其性能,例如,AltaVista发布的图形演示系统LiveTopic为用户提供一些可选择的词条,并直接根据选择的词条来扩展查询;MetaCrawler元搜索引擎也为用户提供相关反馈的功能;以Muscat系统为基础的Euroferret搜索引擎使用相关反馈技术来帮助用户扩展查询等。相关反馈技术的基本思想是用户对信息检索的结果进行显性或者隐性的相关性判定,系统根据这些

4、判断对查询进行处理,重新检索从而提高最终结果的质量。相关反馈技术的运用或者是为了实现查询式的扩展,用,果。或者是实现词权的调整,改变词语在查询中的作最终得到相关度最大的文档集,从而改变检索效3基于相关反馈技术的个性化信息检索研究3.1相关反馈技术的可行性分析相关反馈技术与个性化信息检索结合,首先要考虑相关反馈技术的实现方式,从客户端和服务器端结合的角度,分析各种方式的实现策略及优缺点。具体有以下几种:?使用较多的相关反馈策略是“聚类”方法。即已知相关文献中包含的语词可以用于描述更大范围的相关文献。在这种情况下,更大

5、范围相关文献簇的描述是在用户的帮助下交互式建立的。这是一种基本的相关反馈方式,但是用户必须针对一定数量的文献做出相关或者不相关的判断,这里需要进行判断的文献数量不能太少,这样反馈的效果就不明显,也不能太多,用户没有那么多时间和耐心,所以这种方式还有需改?针对用户查询语词的表述不明确或是不够全面,还有一种方法:可以让用户选择一些代表相关文档的句子或者展示给用户一个从初始文档集中抽取的名词词组列表网,这些词与查询语词相关,可能是同义词、近义词、词干变形或者是在文本中与查询语词非常接近的语词,提供给用户进行反馈,在这样的

6、基础上进一步修改查询表达式,优化检索结果。?从用户的检索行为中挖掘反馈信息,不需要用户额外的操作,系统在后台监测用户检索过程,一切有价值的信息都可以被获取来统计分析作为反馈的依据比如,用户在一个搜索结果列表中对不同文献的点击数可能表达了用户的偏好,用户在一个页面的停留时间也能说明其对这篇文档的喜好,等等。但这种方式最大的缺陷是某些信息的干扰性,很多用户的行为与检索的目的无关,只是一种习惯或偶然现象,这时应通过关联分析并配合各种去噪的办法,尽可能剔除这些无用信息的影响。?对用户行为的挖掘不能仅仅局限在当前用户上,相关

7、反馈还应该被用来为所有用户提高检索结果的质比如,搜索引擎能够学习针对某一个或一类查询表达式所列出的检索结果,哪些文献是最频繁被用户访问的,当很多用户都有类似行为后,就可以作为一个反馈信息,为其他更多的用户提供帮助,这种策略的出发点在于任何人的兴趣不是孤立的,应处于某个群体中。利用协作式信息过滤的思想,分析用户兴趣,在用户群体中找到与指定用户的兴趣相同或相似的用户,综合这些相同或相似用户对某一信息的评价,就能形成系统对该指定用户对此信息喜好程度的预测。3.2不同系统中相关反馈的设计差别个性化的信息检索可以用在传统的信

8、息检索系统中,也可以用在网络搜索引擎中,虽然两者信息检索的原理差距不大,但是,在相关反馈的设计上却是有区别的,如果忽略两种检索环境的差异,对检索结果存在一定影响。传统的信息检索系统和网络搜索引擎最主要的差别是面对的用户,因此应该考虑将分析的重点从查询表达式转移到用户,分析两种用户的特性,通过分析可以发现那些DIA-LoG用户的代表,多是信息检索方面的专家,有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。