并行数据库系统

并行数据库系统

ID:30821819

大小:329.33 KB

页数:10页

时间:2019-01-03

并行数据库系统_第1页
并行数据库系统_第2页
并行数据库系统_第3页
并行数据库系统_第4页
并行数据库系统_第5页
资源描述:

《并行数据库系统》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、并行数据库系统1并行数据库概述并行数据库系统是在并行机上运行的具冇并行处理能力的数据库系统,是数据库技术与并行计算技术结介的产物。1.1并行数据库系统的目标:1.高性能"通过将数据库在多个磁盘上分布存储,利用多个处理机对磁盘数据进行并行处理,解决I/O瓶颈问题。通过开发查询间并行性、查询内并行性以及操作内并行性,提高查询效率。2.高可用性。可通过数据复制來増强数据库的可用性,当一-个磁盘损坏时,该盘上的数据在其他磁盘上的副本仍可供使用。3.可扩充性。系统通过增加处理和存储能力而平滑地扩展性能的能力。•线形伸缩

2、比:是指任务扩大N倍、系统处理和存储能力也扩大N倍时系统性能不变,即:小任务在小系统上的运行时间与大(N倍)任务在大系统上的运行时间Z比为lo•线形加速度比:是指任务不变、系统处理和存储能力扩大N倍时系统性能也提高N倍,即:小系统上执行一个任务的时间与人(N倍)系统上执行同一个任务的时间之.比为N。1.2支持并行数据库的并行结构1.2.1共享内存(SM)并行结构图1.1SM结构并行计算机(负荷比鮫均衡、成本高、可用性不是很好)1.2.2共享磁盘(SD)并行结构图1.2SD结构并行计算机(成本低、可扩充性好、可

3、用性强。实现起來比复杂)1.23无共享资源(SN)并行结构图1.3SN结构并行计算机(成木低、可仲缩性与可用性高。实现复杂、节点负荷难均衡)1.2.4三种并行结构比较表1」三种并行结构比较共享内存共享磁盘无共享资源性能最佳较佳较佳可用性低较高可扩充性差较好好负载均衡易做到易做到难做到实现技术容易较复杂复杂成木高较低低处理机数数十个数百个数千个规模屮小系统屮小系统大系统2并行数据库的并行查询处理技术顺序执彳亍计划:SP(Sequentialplan)并行执行计划:PP(Parallelplan)对于查询Q,若某

4、个并行执行计划PP与Q的一个顺序执行计划SP对应于相同的操作树,则称PP为SP的一个并行化方案,而山顺序执行计划SP得到的某个PP的过程称为并行化。例:求每个部门职工的平均工资,并按平均工资升序排列。SELECTDEPTNUMAVG(SAL)AVGSALFROMEMPGROUPBYDEPTNUMORDERBYAVGSAL;这里,分组和排序可以并行(流水线式)。2.1并行粒度并行粒度指的是查询执行的并行程度,可分为四种:(1)事务间并行性。是粒度最粗也是最容易实现的并行性。由于这种并行性允许多个进程或线索同时处

5、理多个用户请求,因此可以显著增加系统吞吐量,支持更多的并发用户。(集中式数据库也这样做)(2)查询间并行性(也就是奇务内并行性)同一事务内的不同查询如果是不相关的,它们并行执行必将提高效率,但是,同一事务内的查询如果是相关的,它们并行执行比较复杂,系统必须进行相关性控制。(3)操作间并行性(也就是查询内并行性)同一査询内的不同操作往往可以并行执行。考虑一条SQL査询语句可以分解成多个子操作,有多个处理机执行。例如下列查询:SELECTDEPTNUM,EMPNUMFROMDEPT,EMPWHEREDEPT,de

6、ptnum=EMP.deptnumGROUPBYDEPTNUMORDERBYDEPTNUM:可以分解为扫描DEPT表和EMP表,对两表进行结合,对结合结果排序以及分组和输出五个子任务。前一操作的输出即是F-操作的输入。如果厉一操作等待前一操作产生一定量的输出后(而不必等待前一操作执行完毕)即可在另一处理机上开始执行,这种并行方式称为垂直并行或流水线并行。(4)操作内(intFa・()peration)并行性操作内并行性的粒度戢细,它将同一•操作(如扫描操作、合并操作、排序操作等)分解成多个独立的子操作,由不同

7、的处理机同时执行。事务(Transation)查询(Query)操作(Operation)事务内事务间查询内查询间操作内操作间并行粒度细图2.1四种并行粒度2丄1并行化形式水平并行化(独立并行化,IndependentParallelism)和垂直并行化(流水线并行化,PipeliningParallelism)0P1(a)水平并行化(b)垂直并行化图2.2.并行化的两种形式如果两个操作0P

8、、OP?无相互依赖关系,则称这两个操作相互独立。水平并行化指的是4相独立的多个操作或者一个操作内"•相独立的多个了操作

9、分别山不同的处理机并行执行的形式。如果操作OP2直接依赖于OPI,并口OP2必须等待OP1处理完所冇元组后方可开始执行,则称OP2以阻塞方式直接依赖于OP1;如果OP2无需等待OP1执行完毕即可在另一处理机上开始执行,则称OP2以流水线方式直接依赖TOP1。垂直并行化则是指存在流水线方式依赖关系的操作分别由不同处理机并行执行的形式。例如,排序操作、扫描操作山不同的处理机并行执行就是水平并行化的实例。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。