信息检索效率的探讨

信息检索效率的探讨

ID:36002502

大小:22.00 KB

页数:6页

时间:2019-04-29

信息检索效率的探讨_第1页
信息检索效率的探讨_第2页
信息检索效率的探讨_第3页
信息检索效率的探讨_第4页
信息检索效率的探讨_第5页
资源描述:

《信息检索效率的探讨》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、信息检索效率的探讨[摘要]在信息技术迅速发展的推动下,传统信息服务机构和网络信息服务运营商逐步走上由信息服务向知识服务的转型之路。在这种趋势下,信息检索也由过去单纯的字符匹配逐步转向面向内容、基于知识的信息检索。在这里简单探讨一下基于知识服务的信息检索效率的基本概念和评价指标,剖析语义分析程度、信息模型、检索方法和信息收录范围等主要影响因素,最后通过一个实例,对比分析说明知识服务将提高用户信息检索的效率。[关键字]知识服务信息检索效率引言:进入知识经济时代,知识管理、知识服务的理念得到广泛认同,信息检索技术也由基于关键词的信息

2、检索逐步转向针对文章内容的基于知识的信息检索。后者不再是基于字符的机械匹配,而是更强调语义,模拟人类的思维方式,从语义和概念出发,自动分析信息资源的语义信息,查找和发现具有相关知识单元的信息资源。较之前者,其检索结果更准确,更贴近用户需求。信息检索是将信息按照一定的规律组织起来,找到所需信息的过程和技术,简单的说,就是信息的有序化识别和查找。信息检索效率就是实施识别和查找过程的效率。信息检索效率不仅是影响信息检索工具价值的重要因素,也是评价信息检索技术发展的重要指标。6/6一、基于知识服务的信息检索效率的主要评价指标有检全率、

3、检准率、友好性和检索耗时。二、影响因素分析。基于知识服务的信息检索是建立在语义理解基础之上的智能检索过程,影响检索效率的因素主要有语义分析、信息模型、检索方法和信息收录范围的分述。语义分析是在提供信息检索服务之前,对收录信息资源进行语义层面的分析,发现和标记信息资源的知识单元及相互联系,构建基于信息资源本质内容的知识库。语义分析的目的在于控制检索的语义范围,从而控制检索的范围,保证检索出全部与某特定学科内容相关的信息,剔除所有与此学科内容不相干的信息。可以说,信息检索的范围与语义分析的程度息息相关,语义分析程度越充分,发现的知

4、识单元越丰富,检索结果越全面、准确;反之,语义分析程度不够,能够发现和标记的知识单元就相对较少,检全率和检准率都会降低导致检索效率低下。针对信息资源内容的语义分析包括两个方面:基于内容的定性分析和定量分析。基于内容的定性分析是对信息内容的学科属性进行分析和鉴定。通过语义分析,确定信息所属范畴,从而限定了信息检索的范围。目前定性分析的方法主要有专家法和机器学习法。基于内容的的定量分析是定量的分析信息资源之间的关系,通过对信息资源所含知识单元的数量特征、数量关系和数量发展进行统计分析,区分核心信息资源和一般信息资源的知识单元的差异

5、。6/6信息内容的定性分析能够分析和鉴定信息的学科属性,控制检索的语义范同,保证了能够检索出全部与特定学科内容相关的信息,剔除不相关的信息,提高了信息检索的检全率和检准率。信息内容的定量分析从数量的角度分析信息资源的相互关系,区分出核心信息资源和一般信息资源,使检索过程优先匹配核心信息资源,缩减平均匹配时间,提高检索效率。因此,信息资源的语义分析程度是影响信息检索效率的关键因素。三、信息的检索模型描述信息检索过程中文档表示,查询及其相互关系的模型。信息检索模型决定了查询过程的效率。目前主要的信息检索模型有布尔模型、向量空间模型

6、、概念模型和基于本体的信息检索模型。1、信息的检索布尔模型。基于集合论和布尔代数的一种简单模型,该模型为用户提供了一个容易掌握的方式,输入布尔表达式即可查询。布尔模型定义索引术语只有两种状态:匹配和不匹配,这就导致了索引术语的权重都表现为二元性,要么文档完全匹配,要么文档完全不匹配,布尔模型只能进行精确检索而不能进行模糊检索。2、信息的检索向量模型。向量空间模型是利用空间相似性来表示语义的相似性。文档和查询都用多次元向量表示,如果查询向量和文档向量距离最近,那么这个文档和这个查询的相关度就最大,匹配程度就越高。向量空间模型解决

7、了布尔模型索引术语权重二元性的缺点,提供出符合某向量距离(即相关度数值)范围内的所有检索结果,很大程度的提升了信息检索的检全率,但倘若相关度制定的过低,则会导致检索结果数量过多,影响检索效率。6/63、信息的检索概率模型。概率模型基于以下理论:给定一个查询串q和集合中的文档d,概率模型来估计用户查询串q与文档d相关的概率。概率模型假设这种概率只由查询串和文档决定。更进一步说,该模型假定存在一个所有文档的集合,即相对于查询串q的结果文档子集,这种理想的集合用R表示,集合中的文档是被预料与查询串相关的。4、基于本体的信息检索模型。

8、基于本体的信息检索模型是利用领域本体作为组织资源的基础。首先构建一个涵盖相关领域概念及概念之间关联的本体库,在这基础上确定领域本体的主要概念和概念之间的关系,构筑领域本体的概念模型。该模型的检索过程如下:用户提交检索的关键字,系统查询本体库,从中找到关键字涉及的各个领域,并将

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。