欢迎来到天天文库
浏览记录
ID:50284496
大小:320.50 KB
页数:23页
时间:2020-03-07
《数据库物理结构设计.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第6章物理结构设计●讲授1学时电子教案版本6.6数据库技术●内容概述教学进程6.1物理结构设计的内容6.2选取存取方法6.3设计存储结构6.4确定存储位置6.5选取存储介质6.6评价物理结构6.7SQLServer2005的索引机制6.1物理结构设计的内容物理结构:指数据库在存储介质上的存取方法、存储结构和存放位置。物理结构设计:指根据逻辑结构设计的结果,设计逻辑结构的最佳存取方法、存储结构和存放位置以及合理选择存储介质等,从而设计出适合逻辑结构的最佳物理环境(即:存储模式)的过程。物理结构设计的内容:选取存取方法、设计存储结构、确定存放位置以及选择存储介质等,因素包括
2、:访问类型、访问时间、插入时间、删除时间和空间开销等。(1)存取方法:指用户存取数据库数据的方法和技术。(2)存储结构:指根据逻辑结构的指标以及DBMS支持的数据类型,所确定的数据项的存储类型和长度以及元组的存储结构等即:数据文件及其数据项在介质上的具体存储结构。(3)存放位置:指根数据库文件和索引文件等在介质上的具体存储位置。(4)存储介质:指用于存储文件的物理存储设备。包括:磁盘、磁带、光盘、磁盘阵列、磁带库、光盘阵列等。具体包括:介质的容量大小、存取速度与费用等。物理结构设计的方法:(1)选择存取方法。(2)设计存储结构。(3)确定存放位置。(4)选取存储介质。(
3、5)评价物理结构。结论:通过存取方法、存储结构、存放位置以及存储介质的合理设计,最终为逻辑模式设计出满足应用需求的最佳存储模式。6.2选择存取方法实现数据库快速访问的最有效方法是使用索引机制。索引机制是指对于数据库的数据表,根据数据表的查询需要,按照查询数据所对应的关键属性,为数据表建立相应的用于快速检索的索引文件,在执行查询操作时,先在索引文件中找到查询的元组在数据表中位置(地址),然后再根据这个地址,去数据表中直接取出元组数据。这种先查询索引文件,再从数据表中取值的检索机制称为索引机制。索引表是指把关键属性(例如:主键)的值按照升序(或者降序)排序后,与它对应的元组
4、在数据表中的位置所组成的对照表。即:索引表是索引属性值与元组地址的对照表。索引文件用于存储索引表的文件。温馨提示:索引文件需要配合数据文件一起使用,才能进行快速检索,因此索引文件单独使用没有意义。6.2选择存取方法例如:一本字典是由字典正文和字典索引连部分组成。字典索引相当于索引表,字典正文相当于数据表。字典索引和字典正文一起配合使用实现查询字的用法。具体查询过程如下:(1)首先在字典索引中,查询字在字典中的页码。(2)然后按照页码,字典正文中找到该字的用法。思考题1:对于任意数据表,使用索引机制进行检索与不使用索引机制而直接对数据表进行检索相比,是否前者一定比后者快?
5、思考题2:在什么情况下,使用索引机制可以进行快速检索?常用的存取方法括:平衡树(BalanceTree,B树)、聚簇(Cluster)和散列索引。其中:B树索引是最常用的存取方法,具体操作见数据结构。聚簇索引(了解)聚簇:指根据索引关键属性的值直接找到数据的物理存储位置,从而达到快速检索数据的目的,提高检索的效率。聚簇索引:指在按照关键属性对数据表建立索引时,同时按照索引顺序对数据表的相应元组的物理存储位置进行排序,使索引的顺序与数据表中相应元组的物理顺序始终保持一致的索引过程。聚簇索引与非聚簇索引的区别:1)聚簇索引的顺序与数据的物理存储顺序始终保持一致;非聚簇索引的
6、顺序与数据物理排列顺序无关。2)聚簇索引B+树的叶节点就是数据节点;非聚簇索引B+树的叶节点仍然是索引节点,其指针指向对应的元组或者数据块。3)一个数据表只能有一个聚簇索引;非聚簇索引则可有多个。4)建立和维护非聚簇索引的开销相对较小,而聚簇索引的开销则相当大。5)聚簇索引适合于不需要更新或者更新比较少的应用,非聚簇索引则适合于更新比较多的应用。6)聚簇索引灵活性较差不建议经常适应,非聚簇索引性则相对比较灵活。聚簇索引(了解)使用聚簇索引注意:(1)经常进行连接操作的数据表建议使用聚簇索引。(2)对于属性组的利用率很高或者重复率很高的关系建议使用聚簇索引。(3)需要经常
7、进行插入、删除或修改等更新操作,不建议使用聚簇索引。(4)对于更新操作远多于连接操作的关系不建议使用聚簇索引。温馨提示:聚簇索引虽然可以提高某些应用的性能,但是会改变数据的物理存储位置,而且会导致数据表的原有索引无效,同时维护费用很大,因此需要谨慎使用。6.3设计存储结构存储结构设计的内容:存储的关系模式;关系模式的数据项;数据项的类型,宽度,是否主键,是否外键,是否索引键等。【例6.8】:如果关系R(R1,…,R6,R7,…,R20),包含20个属性,但是前6个属性的利用率非常高,而其它属性的利用率非常低,则存储时可以按照R(R1,…,
此文档下载收益归作者所有