数据库系统实现_02.ppt

数据库系统实现_02.ppt

ID:48193152

大小:86.00 KB

页数:17页

时间:2020-01-18

数据库系统实现_02.ppt_第1页
数据库系统实现_02.ppt_第2页
数据库系统实现_02.ppt_第3页
数据库系统实现_02.ppt_第4页
数据库系统实现_02.ppt_第5页
资源描述:

《数据库系统实现_02.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章数据存储1.存储器层次2.磁盘3.第二级存储器的有效使用4.改善第二级存储器访问时间的策略5.磁盘故障6.磁盘恢复1.存储器层次高速缓冲存储器主存储器第二级存储器(辅存,联机存储)第三级存储器(脱机存储)易失和非易失存储器在各级之间要解决的问题:1.速度瓶颈2.容量瓶颈如主存与辅存之间通过缓冲区:第三级存储器第二级存储器(辅存)主存储器高速缓冲存储器价格及速度容量主存缓冲区辅存2.磁盘磁盘结构磁盘控制器磁盘存储特性磁盘访问特性块的写入块的修改磁盘结构1.磁盘组合:2.磁头组合:又分为移动磁头和固定

2、磁头(高速访问,造价高)3.磁道:4.柱面:为讨论提高数据访问速度5.扇区:从磁盘读出和写入信息的最小单位,也是磁盘错误的最小单位.块是OS或DBMS与磁盘进行交换信息的逻辑单位,一般是扇区的整数倍磁盘控制器1.结构图:总线2.功能:1)定位磁道(或柱面)2)选盘面,并选扇区3)读数据传送到主存(计算效验和数据并与读出的效验和数据比较),或从主存写数据到所选扇区(包括效验和数据)处理器主存磁盘控制器磁盘存储特性1.磁盘组合的旋转速度2.每单元盘片数3.每面磁道数4.每个磁道字节数例:Megatron74

3、7有下列特性:1.4个盘片,8个盘面2.每个盘面有213个磁道(8192个磁道)3.每个磁道平均有28个扇区(256个)4.每个扇区有29个字节(512个)则磁盘容量如下:23*213*28*29=231(8GB)磁盘访问特性1.存取时间(accesstime):从发出读写请求到数据开始传输之间的时间2.寻道时间(seektime),平均寻道时间(averageseektime)寻道时间:磁头重定位的时间(2~30ms)平均寻道时间:4~10ms3.旋转等待时间(rotationallatencytim

4、e),平均旋转等待时间旋转等待时间:磁盘转动到被存取的扇区出现在磁头下所用时间平均旋转等待时间:4.数据传输率(data-transferrate):从磁盘获取数据或者向磁盘存储数据的速率(25M—40M/S)5.平均故障时间(meantimetofailure,MTTF):预期系统无故障连续运行的平均时间块的写入与读出:1)磁头定位(磁道)2)扇区定位3)读或写块的修改1.过程:1)将块读入主存2)对主存中块的副本进行所要求的修改3)将主存中块的内容写回到磁盘4)如果需要,检查写操作(对效验和进行检查

5、)2.所需时间:1)读的时间2)在主存中更新的时间3)写的时间4)进行效验和判定的时间磁盘数据组织与DBMS(或文件)数据组织的关系物理概念逻辑概念磁盘组合磁盘片盘面磁道扇区字节关系(包括数据字典,索引)块记录字段柱面3.第二级存储器的有效使用1.计算的I/O模型2.第二级存储器中的数据排序3.归并排序4.两阶段多路归并排序5.扩展多路归并排序更大的关系1.计算的I/O模型:在DBMS中,所有数据不在主存中,数据访问(或处理)的开销,CPU与I/O速度差,导致在考虑相关算法时,只在乎磁盘块访问(读和写)

6、次数或所需时间,而CPU处理时间忽略不计.目标:为完成某项任务,所实现的算法中,存储器中的块有最少的I/O次数2.第二级存储器中的数据排序(也包括第二级/第三级)讨论:一个表的排序问题,透视如何考虑以I/O开销为主的排序算法1)小表(<=DBMS(主存))2)大表(>>=DBMS(主存))例:表=107行,每行定长=100字节,DBMS(主存)=50M,磁盘块=4K(4096字节),每块=40行,表=250000块DBMS(主存)=12800块1)归并排序(书page31图2-10,算法见书page32

7、)2)一阶段两路归并排序表大小<=DBMS(主存)3)多阶段两路归并排序(淘汰赛)(I/O次数较多)阶段1:排序主存大小的数据片段阶段n:对阶段n-1所排序的数据片段进行两两归并排序4)两阶段多路归并排序阶段1:排序主存大小的数据片段阶段2:对阶段1所排序的数据片段的块进行多路归并排序5)多阶段多路归并排序模拟实现两阶段多路归并排序(DBMS对大表某字段排序时,所采用)要求:1)建立模拟所需的数据结构2)实现两阶段多路归并排序的算法3)测试或演示排序过程4)显示排序时间(时间开销)4.改善第二级存储器访

8、问时间的策略1.按柱面组织数据:将可能一起被访问的块放在同一柱面上,可以减少访问时间问题:如何界定一起访问,预留空间多大等2.使用多磁盘:数据存储在几个独立的磁盘上,而不是集中在一个较大的磁盘上数据库的存储策略也是如此:数据,索引,日志等最好是分布在独立的几个磁盘上3.磁盘镜像(mirror):通过磁盘冗余,提高访问速度,同是也提高数据可靠性4.磁盘调度的电梯算法:通过在OS,或在DBMS,或在磁盘控制器中采用有效的算法(如电梯算法)5.预

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。