从b 树、b+ 树、b 树谈到r 树

从b 树、b+ 树、b 树谈到r 树

ID:26729152

大小:974.00 KB

页数:43页

时间:2018-11-28

从b 树、b+ 树、b 树谈到r 树_第1页
从b 树、b+ 树、b 树谈到r 树_第2页
从b 树、b+ 树、b 树谈到r 树_第3页
从b 树、b+ 树、b 树谈到r 树_第4页
从b 树、b+ 树、b 树谈到r 树_第5页
资源描述:

《从b 树、b+ 树、b 树谈到r 树》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第一节、B树、B+树、B*树1.前言:动态查找树主要有:二叉查找树(BinarySearchTree),平衡二叉查找树(BalancedBinarySearchTree),红黑树(Red-BlackTree),B-tree/B+-tree/B*-tree(B~Tree)。前三者是典型的二叉查找树结构,其查找的时间复杂度O(log2N)与树的深度相关,那么降低树的深度自然会提高查找效率。但是咱们有面对这样一个实际问题:就是大规模数据存储中,实现索引查询这样一个实际背景下,树节点存储的元素数量是有限的(如果元素数量非常多的话,查找就退化成节点内部的线性查找了),这样导致二叉查找树结构由

2、于树的深度过大而造成磁盘I/O读写过于频繁,进而导致查询效率低下(为什么会出现这种情况,待会在外部存储器-磁盘中有所解释),那么如何减少树的深度(当然是不能减少查询的数据量),一个基本的想法就是:采用多叉树结构(由于树节点元素数量是有限的,自然该节点的子树数量也就是有限的)。这样我们就提出了一个新的查找树结构——多路查找树。根据平衡二叉树的启发,自然就想到平衡多路查找树结构,也就是这篇文章所要阐述的第一个主题B~tree(B树结构)。B-tree(B-tree树即B树)这棵神奇的树是在RudolfBayer, EdwardM.McCreight(1970)写的一篇论文《Organi

3、zationandMaintenanceofLargeOrderedIndices》中首次提出的(wikipedia中:http://en.wikipedia.org/wiki/B-tree,阐述了B-tree名字来源以及相关的开源地址)。在开始介绍B~tree之前,先了解下相关的硬件知识,才能很好的了解为什么需要B~tree这种外存数据结构。  2.外存储器—磁盘计算机存储设备一般分为两种:内存储器(mainmemory)和外存储器(externalmemory)。内存存取速度快,但容量小,价格昂贵,而且不能长期保存数据(在不通电情况下数据会消失)。外存储器—磁盘是一种直接存取的

4、存储设备(DASD)。它是以存取时间变化不大为特征的。可以直接存取任何字符组,且容量大、速度较其它外存设备更快。2.1磁盘的构造磁盘是一个扁平的圆盘(与电唱机的唱片类似)。盘面上有许多称为磁道的圆圈,数据就记录在这些磁道上。磁盘可以是单片的,也可以是由若干盘片组成的盘组,每一盘片上有两个面。如下图11.3中所示的6片盘组为例,除去最顶端和最底端的外侧面不存储数据之外,一共有10个面可以用来保存信息。                            当磁盘驱动器执行读/写功能时。盘片装在一个主轴上,并绕主轴高速旋转,当磁道在读/写头(又叫磁头)下通过时,就可以进行数据的读/写了

5、。一般磁盘分为固定头盘(磁头固定)和活动头盘。固定头盘的每一个磁道上都有独立的磁头,它是固定不动的,专门负责这一磁道上数据的读/写。活动头盘(如上图)的磁头是可移动的。每一个盘面上只有一个磁头(磁头是双向的,因此正反盘面都能读写)。它可以从该面的一个磁道移动到另一个磁道。所有磁头都装在同一个动臂上,因此不同盘面上的所有磁头都是同时移动的(行动整齐划一)。当盘片绕主轴旋转的时候,磁头与旋转的盘片形成一个圆柱体。各个盘面上半径相同的磁道组成了一个圆柱面,我们称为柱面。因此,柱面的个数也就是盘面上的磁道数。 2.2磁盘的读/写原理和效率磁盘上数据必须用一个三维地址唯一标示:柱面号、盘面号

6、、块号(磁道上的盘块)。读/写磁盘上某一指定数据需要下面3个步骤:(1) 首先移动臂根据柱面号使磁头移动到所需要的柱面上,这一过程被称为定位或查找。(2) 如上图11.3中所示的6盘组示意图中,所有磁头都定位到了10个盘面的10条磁道上(磁头都是双向的)。这时根据盘面号来确定指定盘面上的磁道。(3)盘面确定以后,盘片开始旋转,将指定块号的磁道段移动至磁头下。经过上面三个步骤,指定数据的存储位置就被找到。这时就可以开始读/写操作了。访问某一具体信息,由3部分时间组成:●查找时间(seektime)Ts:完成上述步骤(1)所需要的时间。这部分时间代价最高,最大可达到0.1s左右。●等待

7、时间(latencytime)Tl:完成上述步骤(3)所需要的时间。由于盘片绕主轴旋转速度很快,一般为7200转/分(电脑硬盘的性能指标之一,家用的普通硬盘的转速一般有5400rpm(笔记本)、7200rpm几种)。因此一般旋转一圈大约0.0083s。●传输时间(transmissiontime)Tt:数据通过系统总线传送到内存的时间,一般传输一个字节(byte)大概0.02us=2*10^(-8)s磁盘读取数据是以盘块(block)为基本单位的。位于同一盘块中的所有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。