基于人工标注的个性化检索系统评测的研究

基于人工标注的个性化检索系统评测的研究

ID:40918281

大小:701.00 KB

页数:11页

时间:2019-08-10

基于人工标注的个性化检索系统评测的研究_第1页
基于人工标注的个性化检索系统评测的研究_第2页
基于人工标注的个性化检索系统评测的研究_第3页
基于人工标注的个性化检索系统评测的研究_第4页
基于人工标注的个性化检索系统评测的研究_第5页
资源描述:

《基于人工标注的个性化检索系统评测的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于人工标注的个性化检索系统评测的研究摘要:个性化信息检索可以根据用户的检索兴趣返回个性化的检索结果。本文构建了个性化检索标注系统和个性化检索评测系统,生成个性化检索系统所需的语料集;并提出了以用户为中心的基于人工标注的个性化检索评价方法。个性化检索评测系统采用了NIST所建立的评价体系,根据用户的标注结果对个性化检索系统的性能进行自动评价,并给出量化、直观的性能指标。关键词:个性化信息检索,以用户为中心,评价方法ResearchonEvaluationofPersonalizedInformationRetrievalBasedonHandMar

2、kingAbstract:Personalizedinformationretrievalcangrasptheusers'retrievalintentionandfindpersonalizedresults.AmarkingsystemandanevaluationsystemforpersonalizedIRarebuilttogeneratethecorpusforevaluatingpersonalizedIRsystem.User-centeredhandmarkingevaluationmethodisproposedinthisp

3、aper.EvaluationsystemprovidedbyNISTisadoptedintheevaluation,automaticevaluationcanbeachievedaccordingtotheresultsmarkingbyusers.Quantifyandintuitiveresultscanalsobegiventhroughthismethod.Keywords:PersonalizedInformationRetrieval;User-centered;EvaluationMethod.1引言随着网络的发展,Intern

4、et上存在大量不同类型的信息资源,搜索引擎作为网络信息检索工具而被人们广泛使用,但是随着网络信息量的增加,面对用户个性化的信息需求,传统搜索引擎日益显现其不足,具体表现在以下几个方面:(1)大部分搜索引擎是基于关键词匹配的,这种匹配完全是一种机械式的匹配,它既不能区分关键词的同形异义,也不能联想到相关同义词,更不可能考虑到关键词所处的特殊语言环境。因此,它不能有效地理解人们的查询请求。(2)用户在选择关键词或构造查询表达式表达其信息需求时往往面临一些困难,对于许多无关信息,往往需要用户花大量时间浏览与选择。(3)传统搜索引擎基本上都是“一个搜索适用

5、所有用户”,对所有用户其检索结果都是一样,不能根据不同的用户给出相应的建议,无法满足用户的个性化需求。由此可见,目前所广泛采用的信息检索技术无法满足不同背景、不同目的和不同时期用户的查询请求。AskJeeves公司负责搜索和产品管理的副总裁拉哈尔-拉霍伊(RahulLahiri)称,“我们未来的产品不是由我们感觉用户需要什么而确定,而是由用户需要什么信息而确定。用户使用我们的产品是需要一种特定的答案,我们的重点也不再是增加诸如音频或是视频等新鲜的玩艺儿,而是要提供用户真正需要的东西。”因此,如何提高搜索引擎检索结果的精度并向用户提供个性化服务已成为

6、搜索引擎技术的一个新的发展方向和研究热点。个性化信息检索是以用户为中心的信息检索技术,它获取以多种形式表达的用户需求(包括显式的、隐式的以及相关用户的需求),并综合利用这些用户信息,提高信息检索系统的性能。首先,不同的用户通过各种途径访问Web资源;其次,系统学习用户的特性,创建用户访问模型;最后,系统根据得到的知识调整服务内容,以适应不同用户的个性化需求[1]11。个性化检索为不同用户提供不同的服务,并满足同一用户的不同时期的需求。个性化服务通过收集和分析用户信息来学习用户的兴趣和行为,从而实现主动推荐的目的。个性化服务技术能充分提高站点的服务质

7、量和访问效率,从而吸引更多的访问者。所以对个性化检索系统的建模效果及系统的评测、度量也是一个非常重要的问题。目前对个性化系统服务质量的评价,不同的系统采用不同的方式和测试数据,还没有一个通用的标准来客观的评价多个不同个性化系统服务质量的优劣。需要研究一种通用的性能指标并开发相应的Benchmark来评价各种不同的个性化检索技术。另外,目前的评价方法大多是基于人工评价的,缺乏自动评价的方法。所以,对个性化信息检索系统如何进行自动评价,也是目前需要解决的问题。本课题的研究不仅仅对个性化检索有着很重要的意义,而且对其他相关研究也有着较大的参考价值。本文按

8、照如下方式组织:第二节介绍个性化信息检索评测的相关研究;第三节介绍个性化检索评测系统的构建;第四节提出以用户为中心的信息检

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。