基于网格的异构数据库集成技术研究

基于网格的异构数据库集成技术研究

ID:34839485

大小:3.52 MB

页数:60页

时间:2019-03-12

基于网格的异构数据库集成技术研究_第1页
基于网格的异构数据库集成技术研究_第2页
基于网格的异构数据库集成技术研究_第3页
基于网格的异构数据库集成技术研究_第4页
基于网格的异构数据库集成技术研究_第5页
资源描述:

《基于网格的异构数据库集成技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、哈尔滨T稗大学硕十学伊论文图1.1数据仓库体系结构2.联邦数据库系统联邦数据库系统(FederatedDatabaseSystem,FDBS)【4】是由参与联邦的半自治的数据库系统组成,目的是实现数据库系统间部分数据的共享。联邦中的每个数据库的操作是独立于其它数据库和联邦的,之所以叫“半自治’’是因为联邦中的所有数据库都添加了彼此访问的接口。对这些半自治数据库的操作进行控制和协调的软件,称为联邦数据库管理系统(FederatedDatabaseManagementSystem,FDBMS)。FDBMS是一个管理中心,它能把各成员

2、数据库模式映射到一个公共的联邦模式,负责各种模式之间的转换工作,自动解决网络传输问题和异构数据库操纵问题,接受联邦用户的数据请求,把这个请求翻译后送到各个目的数据库引擎,并将收到的结果数据集成后返回给用户。FDBS中实现互操作最常用的方法是将每个数据库模式分别和其它所有数据库模式进行映射,这样联邦中需要建立n(n.1)个模式映射规则,但当参与联邦的数据库很多(n值很大)时,建立映射规则的任务将变得很复杂而难于实现。所以,联邦数据库集成系统适合于自治数据库的数量比较小的情况,希望各数据库有较好的自治性,允许用户单独查询,数据库间能

3、够彼此联合回答查询的情况。其体系结构如图1.2所示。哈尔滨T稃人学硕十学位论文图1.2联邦数据厍体系结构3.中介系统中介系统则是一种软件结构,支持虚拟视图或视图集合。它不存储任何实际数据,作用是在用户提交了一个查询后,将用户查询翻译成一个或多个对数据源的查询。然后将数据源的查询结果进行综合处理,汇总并将之返回给用户。用户的查询基于中间模式,不必知道每个专门的数据源的特点,查询执行引擎直接与包装器(Wrapper)打交道,将基于中间件模式的查询转换为基于各个局部数据源的模式。中间件模式更适应于数据源数目多、各局部数据源的自治性很高

4、且局部数据经常变化的Web环境。而且XML的出现使得对各种数据信息的标准化描述成为可能,使系统更易于适应的空间的不同。中介系统与紧耦合联邦数据库相比较有如下优点:中介系统可以集成非数据库数据源,基于中介器(Mediator)的系统中的数据源的查询能力可以是受限制的,数据源可以不支持SQL查询;中介系统中的数据源是完全自治的,这就意味着很容易向/从系统中添加/删除数据源【5】。中介系统的主要部分是中介器和针对每个数据源的包装器(Wrapper)。这里中介器的功能是接收针对全局模式生成的查询,根据数据源描述信息及映射规则将接收的查询

5、分解成每个数据源的子查询,再根据数据源描述信息优化查询计划,最后将子查询发送到每个数据源包装器。包装器将这些子查询翻译成符合每个数据源模型和模式的查询,并把查询结果返回给中介器。中介器将接收的所有数据源的结果合并成一个结果返回给用户。4哈尔滨T程大学硕十学伊论文网格环境所面对的是大量的分布式异构数掘源且数据源吏新频繁,凶此基于网格的数据库集成通常采用的是中介系统的方法,这不仅可以避免联邦数据系统对联邦中数据源数量的限制,也可以避免数据仓库中无法对数据进行实时查询的缺点。国外对于基于网格的数据库集成相关研究工作起步较早,水平较高,

6、成果较多。其中比较著名的项目有Spitfiret61、OGSA.DQp[r]、Oracle109[8】和开放网格服务架构.数据访问和集成(OpenGridServicesArchitecture.DataAccessandIntegration,OGSA.DAI)【9J等。国内在数据网格方面的相关研究仍处于起步阶段,但已有一些成功的范例,科学数据网格(ScientificDataGrid,SDG)【loJ就是其中的典型应用。Spitfire和OGSA.DQP是尝试在网格中管理数据库的项目。Spitfire使用WebService

7、技术提供基于SOAP的远程过程调用来对数据库进行操作如对一行或几行的查询插入等,但它不能处理大数据集和一些复杂的操作。OGSA-DQP的目的是为了提供有效的数据服务编排功能,并对数据服务进行查询和分析。它由GDQS和GES两部分组成。GDQS是一个协调器,它能够对查询语句进行编译、优化、划分和调度,并生成查询计划;GES是一个评估器,被用于执行查询计划并获取相应的数据。不过它有三个明显的缺点:一是使用的查询语言是OQL,需要用户重新学习;二是GDQS使用的编译期是基于Polar水的,依赖于Linux平台,且安装使用复杂;三是DQ

8、P还不太完善,很多功能还在进展之中。Oracle109是美国Oracle公司推出的第一个真正的网格数据库。Oracle109作为网格资源的使用方、服务和数据的提供方,对数据库利用存储和服务器的方式进行了虚拟化,自动地将集群化的存储器和服务器供应给网格中的不同数据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。