欢迎来到天天文库
浏览记录
ID:21878631
大小:57.00 KB
页数:7页
时间:2018-10-25
《基于语义的信息集成系统分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于语义的信息集成系统分析摘要:语义X强调互联X应是数据之X,信息的关联应该依靠链接数据。文章以领域本体为基础,以数据集成为原理,建立了基于语义的信息集成系统。用户的查询是基于语义的,参照基于视图的查询响应方法,实施于全局模式上的查询转化为数据源上的查询。 关键词:语义信息集成查询 互联X上的信急检索机制给人们带来了极大的方便,但也存在着一些问题:面对用户输入的查询条件,系统或给出海量的检索结果,或遗漏了一些目标文档,其主要原因归结起来有两点:一方面现行的互联X是文档之X,同一领域和主题的信息依赖超级链接进行关联,普通应用程序只对X页上的内容进行简单处理。由于缺乏语义描述的支
2、持,所以处理的结果是大量的文档,其中绝大部分与查询内容无关。另一方面,数据缺乏语义。在各种现行的信息索引系统中,与查询信息相关的数据缺乏必要的语义描述,搜索引擎的搜索机制是基于文本的关键词匹配,缺乏推理的支持,导致了大量工作仍需要用户自己完成。语义X技术的发展为传统的信息集成领域带来了新的契机,构建基于语义的信息集成系统对于知识的表示、信息的组织与检索等有着重要的意义。本文通过对领域本体的构建方法和对基于本体的数据集成方法的分析,提出一种基于语义的信息集成模型,改进传统的基于视图的查询响应方法。 一、本体的构建 本体用于描述概念及概念之间的关系,并通过这种描述来定义词汇的
3、语义。作为一种有效表现概念层次结构和语义的模型,本体已经被广泛地应用到计算机科学的众多领域。在构造领域本体的时候,最重要的是要确定本体中的概念(类)和它们之间的关系,这种关系称为概念的属性,是概念与概念之间的“桥梁”领域。 本体的构建是一项复杂的工程,需要一整套的机制来支持和开展。并不存在着一个完全“正确”的本体构建方法,因为至少到目前为止,还没有一个公认的完整的本体评价机制,这也是本体工程中有待解决的一个问题。 二、基于本体的数据集成 数据集成旨在解决异构数据源的互操作问题。一些机构或领域可能拥有很多相互之间有信息关联却无法兼容的异构数据源,出于某种需求,用户需要对整
4、个领域进行全局的信息检索,此时,数据的集成就成为解决这一问题的基本手段。 数据的异构主要有结构异构、语法异构和语义异构。结构异构和语法异构在传统的数据集成中已经得到较好的解决,但是对于语义上的异构问题,传统的数据集成技术则不能解决。这是因为语义的异构主要来自于不同系统中的数据源使用了不同的概念描述了同一事物,或是使用了相同的概念描述了不同的事物,前者称为异名同义问题,后者称为同名异义问题。本体的引入有助于解决这一问题。在基于本体的数据集成系统中,本体的作用主要有两个:表示概念和用于构建全局模式。 三、基于视图的查询响应及RDF/OWL视图 在数据集成的应用领域,利用视图
5、进行查询响应的主要目的是建立一个全局视图。数据集成的方法主要有全局视图法和局部视图法。全局视图法中的全局模式是在数据源视图基础上建立的,它由一系列元素组成,每个元素对应一个(组)数据源,表示相应数据源的数据结构和操作;局部视图法中先构建全局模式,数据源的数据视图则是参照全局模式而定义,由全局模式按一定的规则推理得到。相比较而言,全局视图法容易实现,因为实施于全局模式上的查询只需简单地按规则展开便可转换成各个数据源上的子查询,类似于普通数据库上的查询操作。但是,全局视图法不能很好地支持数据源的史新,因为任一个数据源的史新都可能影响到全局视图。 与全局视图法相比,局部视图法的优点是它较
6、好地支持了数据源的史新,有着良好的可扩展性。对于局部视图法而言,当其中的数据源更新时,只需参照全局模式的要求更新这组视图的定义即可,而无需更改系统的其他部分。但是,局部视图法的映射算法实现起来比较复杂,所以,全局模式上的查询转化成视图上的运算后,所得到的结果可能只是原始查询理论解的一个子集。 以RDF/OWL视图的形式定义好各数据源以后,系统就具备将语义查询(SPARQL查询)转化为SQL查询的条件了。 四、SPARQL查询向SQL查询的转化 在局部视图法中,两个关键问摘要:语义X强调互联X应是数据之X,信息的关联应该依靠链接数据。文章以领域本体为基础,以数据集成为原理
7、,建立了基于语义的信息集成系统。用户的查询是基于语义的,参照基于视图的查询响应方法,实施于全局模式上的查询转化为数据源上的查询。 关键词:语义信息集成查询 互联X上的信急检索机制给人们带来了极大的方便,但也存在着一些问题:面对用户输入的查询条件,系统或给出海量的检索结果,或遗漏了一些目标文档,其主要原因归结起来有两点:一方面现行的互联X是文档之X,同一领域和主题的信息依赖超级链接进行关联,普通应用程序只对X页上的内容进行简单处理。由于缺乏语义描述的
此文档下载收益归作者所有