浅谈互联网几种信息检索模型比较

浅谈互联网几种信息检索模型比较

ID:20702405

大小:55.50 KB

页数:6页

时间:2018-10-15

浅谈互联网几种信息检索模型比较_第1页
浅谈互联网几种信息检索模型比较_第2页
浅谈互联网几种信息检索模型比较_第3页
浅谈互联网几种信息检索模型比较_第4页
浅谈互联网几种信息检索模型比较_第5页
资源描述:

《浅谈互联网几种信息检索模型比较》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浅谈互联网几种信息检索模型比较:对信息检索模型研究的主要内容和构建策略进行了描述,给出了几种常用的信息检索模型相关性算法,分析了它们的优缺点,并就存在的问题进行了探讨,总结了信息检索模型的研究现状和发展趋势。    parisiononInformationRetrievaModels  (JiangsuProvincialmunicationsPlanningandDesignInstituteCo.,LTD,Nanjing 210005,China)  Abstract:Thisarticledescribedthemaincontentsandthe

2、constructionstrategyofthemodelsofinformationretrieval,demonstratedalotofmethodsinmonusages,odelofinformationretrieval.Andinthisarticle,theadvantagesanddisadvantagessthatisstillexistinghavebeenresearched.Inaddition,thecurrentsituationofthisresearchandthedevelopmenttendencyofthemode

3、lofinformationretrievalmarizadinthisarticle.  Keyationretrievalmodels;Relativity;Inquiry;Searchengine  当前,随着互联X的普及和X上信息的爆炸式增长,信息检索系统及其核心技术搜索引擎的性能和效率问题已成为人们研究和关注的焦点。影响一个搜索引擎系统的性能有很多因素,但最主要的是信息检索模型,其研究内容包括文档和查询的表示方法、评价文档和用户查询相关性的匹配策略、查询结果的排序方法和用户进行相关度反馈的机制。本文从研究文档与用户查询“相关性”匹配的角度出发,对

4、信息检索模型研究的主要内容和构建策略进行了详细的描述,并给出了几种常用的信息检索模型相关性算法,分析了它们的优缺点及存在的问题,总结了当前信息检索模型的研究现状和发展趋势,其目的在于提高信息检索、查询的性能和效率。  一、构建信息检索模型的策略  当前,构建信息检索模型的主要策略有以下两个:  (一)通用的信息检索模型  构建一个通用的信息检索模型,研究优化的匹配算法,提高查询速度、查全率和查准率,最大程度地满足一般用户的查询需求。  (二)用户兴趣模型  根据特定用户查询兴趣要求构建用户兴趣模型或共同兴趣模型,能够尽可能地满足特殊用户查询的需求。它可以构

5、建一个适合行业或专业应用语义要求信息获取模型。如google就能推断用户的使用意图,提供动态的、即时的用户“个性化定制”信息,帮助用户快速、准确地定位到所需要的信息。  二、常用的信息检索相关性算法  (一)布尔模型  布尔模型是基于特征项的严格匹配模型,文本查询的匹配规则遵循布尔运算的法则。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索引擎则根据事先建立的倒排文件结构,确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。查询结果一般不进行相关性排序。  在布尔模型中,一个文档通过一个关键词条的集合来表示,这些词

6、条都来自一个词典。在查询与文档匹配的过程中,主要看该文档中的词条是否满足查询条件。布尔模型用文档的检索状态值作为一种评价查询和文档相似性的一种方法。这里,首先定义关键词集合S,关键词为t1,t2,…,tn。  这些关键词可以和逻辑操作符AND,OR和NOT形成不同的条件查询。如果得到条件表达式的值为True,该文档相对于此条查询的检索状态值为1;如果若干文档相对于此条查询的检索状态值都为1,则可以认为,这些文档与此用户的查询是相关的。  布尔模型的主要优点有两点:一是实现起来比较容易,速度快,计算的代价相对较少。二是查询语言表达简单,用户可以使用任意复杂的

7、查询表达式,易于表示同义关系(如:聋教育OR特殊教育)和词组(如:计算机AND基础AND课程改革)。它的缺点是,由于所有检索到的与用户查询条件相关的文档具有相同的检索状态值,则不能对查询结果按照相关性进行排序;另外关键词也没有考虑权重的影响,缺乏定量分析和灵活性以及不能表述模糊匹配。而为了克服布尔型信息获取模型查询结果的无序性,在查询结果处理中引进了模糊逻辑运算,将所检索的数据库文档信息与用户的查询要求进行模糊逻辑比较,按照相关的优先次序排列查询结果。  (二)向量空间模型  向量空间模型把信息库中的文本以及用户的查询都表示成向量空间中的点(向量),用它们

8、之间夹角的余弦作为相似性度量。向量空间模型是现在的文本检索系统以及

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。