欢迎来到天天文库
浏览记录
ID:31934980
大小:7.39 MB
页数:61页
时间:2019-01-29
《分布式数据库查询优化算法-研究与实现》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、(1)黔,是IBM圣约瑟研究实验室磅割豹SystemR分布式焉继;(2)分布的INGRES,是美国加州大学伯克利分校研制的INGRES分布式后继;(3)POREL,出德国斯图加特大学E.J。Nuehold教授领导研制:(4)SURIUS,由法国政府通过INRIA组织的DDBMS研究项目;(5)DDM,也是美国计算机公司设计和实现的DDBMS,这是与Ada研究相关的项目,它支持嵌入到Ada中的Adaplex来作为DDB用户的接口。我国对分布式数据库系统的研究始于80年代初,而且在短短的几年中做出了许多有益的
2、成果,建立和实现了A个各具特色酶分布式数据库原型,其中包括武汉大学数据库组研制的WDDBS,东北大学数据库组研制的DMU/F0系统,东南大学计算帆系开发的SUNDDB系统,中国入民大学与知识_工程研究所研制鲍DOS/SELS等,这些系统的研制对我国的分布式数据库技术的理论研究和开发应用起到了积极的接动作用。1.3分布式数据库查询优化技术现状分布式数据库存在于网络环境中,由于数据的分布性,一次查询所操纵的对象可能分布于不同的网络节点中,带来的开销和执行速度会不一样,优化的所要考虑的蠢素就更为复杂。分布式数据
3、库环境中的查询优化和集中式数据库环境中的查询优化相比,要增加对以下两个关键问题的考虑n引:(1)数据和信息均要逶过通信线路进行传输,存在的延迟将减慢整个查询执行过程。(2)网络中多处理器的存在提供了并行处理和传输的机会,应充分利用以加快查询响应的速度。查询优化器n蚰的主要任务是控制和加快查询的执行和数据的传输过程嗍。在分布式处理技术中,查询优化同样也包括两类:针对查询执行代价的优化和针对查询响应时间的优化乜u。但要考虑的因素的偏重方面却不一样。查询响应时间对一个组织机构瑟言,往往就代表着执行代价,所以,查
4、询响应时闻是我们最终要关心的核心问题。‘查询执行代价的优化也是为缩短响应时间服务的。对响应时间的优化主要是利用并行技术,网络环境中的多处理机提供了并行处理能力。关键路径上的局部查询,即对全局响应时间起决定性作用的那部分查询,尤其应该重视。此外,尽量减少查询中通信开销、避免通信线路的瓶颈,也是不可忽略的重要方面。但这方面的理论探讨和实践都还很不成熟和完善。特别是在异构的数据库中,对查询的处理除了有同构系统中那些问题外,还存在以下一些急需考虑的因素嘲:(1)分布在几个站点的数据库可能部分重叠,站点间的操作也可
5、能发生变化。2(2)局部查询开销因站点不同可能发生变化。(3)不能认为所有的站点均能从外部系统读取数据记录。(4)局部数据库系统可能不能完成查询优化器分派的查询处理。分布式查询技术的复杂性并没有阻碍人们对它的研究和探讨,正是由于它涉及因素的多样性和复杂性以及存在于网络环境的分布式系统的优点,决定了它应用的重要性和广泛性嘲。不同地域的单位、组织、个人对资源共享的需求是推动其发展的动力。基于网络架构的分布式数据库系统所具有的优点和扩展性、可用性、可靠性和灵活性,吸引着越来越多的探索者,其应用需求促使其成为当今
6、研究的热点课题乜们。许多数据库领域的专家学者,经过不懈的努力,虽不尽满意,但不同程度的在不同侧面上做出了贡献。1.4本文的组织本文共分5章。第一章为绪论。介绍了分布式数据库系统的发展和分布式查询优化技术的现状,并给出论文的结构安排。第二章详细介绍了分布式数据库查询优化处理的相关基础理论知识。第三章详细介绍了分布式数据库查询优化的技术实现。第四章分析了传统的半连接查询优化算法,在此基础上提出了改进的半连接查询优化算法,并通过实验对该算法进行了验证分析,得出结论。第五章探讨了粒子群优化算法在分布式数据库的复杂
7、多连接查询优化中的应用,提出了一种求解多连接查询优化问题的MJPSO算法,并进行实验分析。最后对全文进行总结并对今后的工作提出了展望。3第二章分布式数据库中的查询处理和优化2.1分布式查询优化概述查询优化问题一直是数据库领域的一个研究重点,尽管很多研究者做了大量的工作,但与关系数据库技术在数据处理中的成功应用不相称的是,多连接查询优化溉矧一直是关系数据库系统中的一个没有很好解决的问题。1.分布式查询优化目标分布式查询处理是用户与分布式数据库系统的接口,也是分布式数据库研究的主要问题之一。在集中式数据库系统
8、中,查询优化的目的是为每个用户查询寻求总代价最小的执行策略。通常,总代价是以查询处理期间的CPU代价和I/o代价来衡量的。由于集中式数据库系统大都运行在单个处理器的计算机上,要达到使总代价最小的查询优化目的,就意味着要尽可能降低I/O代价,使查询的响应时间最短。在分布式数据库系统中,。个查询可能涉及多个站点,通常以两种不同的目标来考虑查询优化。一种目标是以总代价最小为标准,除了如集中式数据库系统一样考虑CPU代价和I/0代价以
此文档下载收益归作者所有