lav数据集成系统的查询处理

lav数据集成系统的查询处理

ID:33724120

大小:3.86 MB

页数:104页

时间:2019-02-28

lav数据集成系统的查询处理_第1页
lav数据集成系统的查询处理_第2页
lav数据集成系统的查询处理_第3页
lav数据集成系统的查询处理_第4页
lav数据集成系统的查询处理_第5页
资源描述:

《lav数据集成系统的查询处理》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、梗盟大学学校代码:10246学号:990304博士学位论文LAV数据集成系统的查询处理院系(所):信息挝堂皇王程堂院专姓业:让簋扭筮鲑当理论名:医毖基指导教师:旌伯压教援零谶踹勤全戈公珏⋯LAV数据集成系统的商询处理摘要分布式数据集成系统连接物理或逻辑上分布于不同位置的数据源,向用户提供对这些数据源的一个综合全面的全局视图,同时负责对这些数据源的自动访问和访问结果的集成。分布式数据集成具有广泛的应用前景,例如因特网上商务信息的集成,集成各个政府部门信息的面向公众的电子政务系统,企业之间以及企业各部门之间的信息共享和协作都需要数据

2、集成。数据仓库、对等(peer—to—peer)结构以及中介器结构都可以用于实现分布式数据集成。本文以中介器结构数据集成为背景,重点研究了实现中介器上查询处理的若干关键问题。作为后续内容的基础,本文首先介绍了构成数据集成系统基本结构的全局数据模式、基于这个全局模式描述的每个数据源局部模式。随后的内容在以下几方面展丌。1.基于数据源的查询重写:本文的数据集成系统采用LAV方式,数据源被描述为基于全局模式的视图,因此可以通过查询重写技术构造对全局查询的处理过程。查询重写技术来源于利用实化视图(MatezializedView)处理查

3、询的需要。其算法复杂性龟括构造视图与查询之间的变量映射和组合这些变量映射这商个相互独立的NP完全问题,现有算法往往通过简单的枚举检查所有可能的变量映射和这些映射的所有组合,其结果是需要做很多无效或冗余的检查和计算。本文针对这两个问题提出了在实现中的优化方法,在构造视图与查询之间的变量映射关系时限定只产生不被包含的映射,并且提出一种方法在特定情况下可以利用Bachman图按唯一的计算顺序构造出所有不被包含的映射。在组合各种映射构造查询重写阶段,本文提出的算法避免了对所有可能的映射组合的构造,而只组合和检查能够覆盖当前查询所有子目标

4、的奄询重写。此外,本文还针对数据源具有查询能力约束或某些语义约束的情况改进了有关的算法。2.查询优化:分布式数据集成系统查询优化的目标与集中式数据库有所不同。本文从降低网络数据流量和提高查询响应速度两个方面研究优化问题。首先,在安排多个联接操作的顺序方面,本文证明了以降低网络数据流量为优化目标时只需要考虑线性联接树构成的联接顺序,但如果以提高查询响应速度为目的,则需要同时考虑包括灌木型树在内的所有联接顺序,并提出了相应的算法。其次,在实际环境中,数据源以及网络的性能在一定程度上是动态变化的,静态的查询计划很难适应,但以往的研究几

5、乎都忽视了这个问题。而本文则提出了直接把联接计划的构造策略结合到查询执行过程中的方法,能够根据网络的当前状况动态调整联接操作的执1亍顺序。最后,为了优化选择操作,本文提出了在数据源之间分配选择条件的方法,能够尽量多地利用数掘源本地的处理能力以降低网络数据流量和提高查询响应速度。3.构造datalog程序处理查嘲:在丌放世界假设下,为了得到尽量多的查询结果并避免对相同数据源的重复访问,~个更好的方法是把复口人学博十学位论文LAV数据集成系统的查询处理!查询过程表达为datalog程序。采用Datalog程序的另一个优点是可以在程序

6、中包含对信息查询路径的利用,真正从全局上利用来自所有数据源的信息处理查询。但在构造这种datalog程序时,需要保证数据的语义,避免构造出无意义的datalog规则,这在以往的有关工作中没有得到应有的重视。本文提出的算法在这方面做了增强,并通过有关实验证明了这个算法的有效性。这种方法的一个缺点是每处理一个新的查询,都需要重新构造数据源之间的信息查询路径,但在一个数据集成系统中数据源是相对固定的,因此可以事先建立好这种信息查询路径,并保存为有向图的形式,这样还可以在一定程度上把构造datalog程序的问题转换为图中的路径查找问题。

7、本文最后介绍了一个初步的分布式数据集成系统体系结构,这个系统目前正结合上海市洋山港信息系统的有关部分进行实施。关键词:自治数据源,查询重写,绑定模式,查询计划,数据源能力,数据集成,datalog程序,线性联接树,灌木型联接树,执行空间。复咀大学博士学位论文一一生!型!!!!!型!!!!!型!!!!!!!!!!!!!!!!!!!!!—●——_—_—___—^———————-_——————————_—_—-_________-●—●—____-—^——__———●———————————————————AbstractAdistri

8、buteddataintegrationsystemconnectsdataSOUrCeSscatteredacrossdifferentsites,andprovidesautomaticallyaccessingtothem.Also,itintegrate

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。