欢迎来到天天文库
浏览记录
ID:34841579
大小:1.29 MB
页数:52页
时间:2019-03-12
《基于语义网的信息内容检索》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、综述信息时代,信息资源无论是在数量上,还是在质量上,都有巨大的飞跃。信息资源在某种程度上成为信息用户的负担,信息检索成为一种重要的社会活动。但是相当多信息检索系统往往难以提供令人满意的检索结果。信息用户需要快速有效地获取信息内容,提高学习的效果和吸收知识的速度。信息检索系统应该满足信息用户对信息内容的需求。如何通过信息检索有效的获取信息内容将是一个长期的发展过程,传统的信息检索必需顺应时代潮流,朝着信息内容检索方向发展。根据信息处理的逻辑过程,传统的信息检索(如下图所示)可以划分为四个组成部分,即语义空间、信息表示、信息检索
2、过程和信息检索结果。语义空间是信息检索的平台和基础。信息资源和信息需求表示为信息检索提供匹配对象。结果分析可以评价检索效果,从而改进信息检索的各个方面。传统的信息检索的四个部分相互关联相互影响,通常后一部分是前一部分的处理结果,同时后一部分可以反过来影响和改进前一部分。传统的信息检索是这样一个过程,在同一语义空间描述信息资源和信息需求,提取它们的特征信息,通过匹配和计算这些特征信息,从而判定信息资源与信息需求的相似程度,检索出与信息需求相关的信息资源。传统的信息检索模型信息检索的深度是影响信息检索效果的重要因素。信息资源处理
3、的程度越深入,信息检索的结果就越能够满足信息用户的信息需求。传统信息检索的深度,无论是信息线索.还是基于信息内容,都是提取信息资源的特征信息,然后对这些特征信息进行比较和匹配,而不是真实的信息资源内容的表示和处理。如果信息检索系统能够真实的处理信息资源内容,那么检索的结果一定能够在最大程度上满足信息用户的信息需求。语义网是一个多层技术框架体系,能够表达信息资源含义,描述信息资源之间的关系,依靠统一的概念体系,通过代理程序计算机能够自动进行数据处理、交换和重复使用。首先是表达含义,采用结构化的xllIL文档描述信息的内容;其次
4、是表示关系,用RDF框架体系表示词语或概念之间的逻辑关系;第三是表示概念,建立一份包括一套分类和推理规则正式定义名词之间关系的文档或文件(Ontology),最后是代理,利用计算机程序自动代理应用。利用语义网技术,可以描述和表达信息资源语义内涵,从而深刻地揭示信息资源。信息资源在信息内容或知识内涵上具有集中与离散分布特点。信息的离散与集中分布规律是事物存在和发展的普遍规律。布拉德福最先发现文献的集中与离散规律,以后信息科学家不断的发展和完善这一规律,同时用数学的方法描述了这一规律。文献的集中与离散分布规律在人们生活实践中得到
5、了检验和验证,主要表现在大量的科学文献集中在少量的科技期刊上,而少量的科技文献却广泛分布在大量的科技期刊上。信息资源是表达和传递信息内容的工具或载体,信息内容在不同的信息资源中分布不同,大量的信息内容集中在少量的信息资源之中,而少量的信息内容则分布在大量的信息资源之中。虽然现在不能定量的计算和表示不同信息资源的信息内容,但是可以区分哪一些信息资源的内容相对丰富。信息内容检索是以信息内容的集中与离散分布规律为理论基础,建立一种对信息资源内容本身的语义定性和语用定量评价体系,区分不同信息资源的知识内涵,从而检索出具有较多信息内容
6、的信息资源。传统信息检索,通常依靠特征信息的语词匹配程度,说明信息资源符合信息用户的信息需求的程度。而信息内容检索依靠语义定性分析,鉴定信息资源所属语义空间,控制信息资源的内容的学科和主题范围。信息内容检索从三个不同的角度,即信息资源生产者、信息工作者和信息用户的角度,建立对信息资源的定量评价和比较体系,2区分不同的信息资源在不同的情况下的不同语用价值,从而发现和挖掘出具有较多知识内涵的信息资源。信息内容检索技术是语义网技术应用于传统信息检索技术的产物,语义网技术提供了定性分析手段,扩展了信息检索的语义空间。信息内容检索技术
7、引入了定量分析手段,检索的过程也是定量分析的过程。信息内容检索是未来检索技术发展的重要方向,必将带来信息检索的革命性变化。本论文以“信息计量学”为主题,利用语义网技术定性分析了不同科技文献的语义内涵,利用引用关系定量分析了不同的科技文献的知识内涵,构建了基于语义网的信息内容检索模型,实现了检索出相关核心科技文献的实例。当然,本文构建的信息内容检索技术还有很多方面需要进一步研究和发展,如信息内容的语义定量方法的建立、不同信息生产者的不同学科价值的确定等。目前国内外对信息内容检索的研究处于萌芽阶段,几乎没有发现正式提出信息内容检
8、索的相关论文,也没有发现相关的信息检索系统。只是有些信息检索系统已经有了信息内容检索的某些特征。在语义处理上,很多论文探讨了基于概念和主题词表的信息检索,根据检索结果的多少,自动扩展和缩小检索的语义空间。在语用处理上,国际著名的搜索引擎Google(_w.google.tom)通过链接关系
此文档下载收益归作者所有