欢迎来到天天文库
浏览记录
ID:52124448
大小:364.84 KB
页数:24页
时间:2020-04-01
《数据库设计-物理设计.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据库设计-物理设计单世民数据库的物理设计数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于给定的计算机系统。为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的物理设计。数据库的物理设计数据库的物理设计的内容和方法设计物理数据库结构的准备工作充分了解应用环境,详细分析要运行的事务,以获得选择物理数据库设计所需参数充分了解所用RDBMS的内部特征,特别是系统提供的存取方法和存储结构数据库的物理设计数据库的物理设计的内容和方法选择物理数据库设计所需参数数据库查询事
2、务查询的关系查询条件所涉及的属性连接条件所涉及的属性查询的投影属性数据更新事务被更新的关系每个关系上的更新操作条件所涉及的属性修改操作要改变的属性值每个事务在各关系上运行的频率和性能要求数据库的物理设计关系数据库物理设计的内容为关系模式选择存取方法(建立存取路径)设计关系、索引等数据库文件的物理存储结构关系模式存取方法选择数据库系统是多用户共享的系统,对同一个关系要建立多条存取路径才能满足多用户的多种应用要求。物理设计的第一个任务就是要确定选择哪些存取方法,即建立哪些存取路径。DBMS常用存取方法索引方
3、法,目前主要是B+树索引方法聚簇(Cluster)方法HASH方法关系模式存取方法选择索引存取方法的选择选择索引存取方法的主要内容根据应用要求确定对哪些属性列建立索引对哪些属性列建立组合索引对哪些索引要设计为唯一索引选择索引存取方法的一般规则如果一个(或一组)属性经常在查询条件中出现,则考虑在这个(或这组)属性上建立索引(或组合索引)如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引如果一个(或一组)属性经常在连接操作的连接条件中出现,则考虑在这个(或这组)属性上建立索引关系
4、上定义的索引数过多会带来较多的额外开销维护索引的开销查找索引的开销关系模式存取方法选择聚簇索引建立聚簇索引后,基表中数据也需要按指定的聚簇属性值的升序或降序存放。也即聚簇索引的索引项顺序与表中元组的物理顺序一致。在一个基本表上最多只能建立一个聚簇索引聚簇索引的用途对于某些类型的查询,可以提高查询效率聚簇索引的适用范围很少对基表进行增删操作很少对其中的变长列进行修改操作关系模式存取方法选择聚簇为了提高某个属性(或属性组)的查询速度,把这个或这些属性(称为聚簇码)上具有相同值的元组集中存放在连续的物理块称为
5、聚簇。许多关系型DBMS都提供了聚簇功能关系模式存取方法选择聚簇的用途大大提高按聚簇属性进行查询的效率例:假设学生关系按所在系建有索引,现在要查询信息系的所有学生名单。信息系的500名学生分布在500个不同的物理块上时,至少要执行500次I/O操作。如果将同一系的学生元组集中存放,则每读一个物理块可得到多个满足查询条件的元组,从而显著地减少了访问磁盘的次数。节省存储空间聚簇以后,聚簇码相同的元组集中在一起了,因而聚簇码值不必在每个元组中重复存储,只要在一组中存一次就行了关系模式存取方法选择聚簇的局限性聚
6、簇只能提高某些特定应用的性能建立与维护聚簇的开销相当大对已有关系建立聚簇,将导致关系中元组移动其物理存储位置,并使此关系上原有的索引无效,必须重建。当一个元组的聚簇码改变时,该元组的存储位置也要做相应移动。关系模式存取方法选择聚簇的适用范围既适用于单个关系独立聚簇,也适用于多个关系组合聚簇例:假设用户经常要按系别查询学生成绩单,这一查询涉及学生关系和选修关系的连接操作,即需要按学号连接这两个关系,为提高连接操作的效率,可以把具有相同学号值的学生元组和选修元组在物理上聚簇在一起。这就相当于把多个关系按“预
7、连接”的形式存放,从而大大提高连接操作的效率。关系模式存取方法选择聚簇的适用范围当通过聚簇码进行访问或连接是该关系的主要应用,与聚簇码无关的其他访问很少或者是次要的时,可以使用聚簇。尤其当SQL语句中包含有与聚簇码有关的ORDERBY,GROUPBY,UNION,DISTINCT等子句或短语时,使用聚簇特别有利,可以省去对结果集的排序操作关系模式存取方法选择选择聚簇存取方法1.设计候选聚簇对经常在一起进行连接操作的关系可以建立组合聚簇;如果一个关系的一组属性经常出现在相等比较条件中,则该单个关系可建立聚
8、簇;如果一个关系的一个(或一组)属性上的值重复率很高,则此单个关系可建立聚簇。即对应每个聚簇码值的平均元组数不太少。太少了,聚簇的效果不明显。关系模式存取方法选择选择聚簇存取方法2.检查候选聚簇中的关系,取消其中不必要的关系从独立聚簇中删除经常进行全表扫描的关系;从独立/组合聚簇中删除更新操作远多于查询操作的关系;从独立/组合聚簇中删除重复出现的关系当一个关系同时加入多个聚簇时,必须从这多个聚簇方案(包括不建立聚簇)中选择一个较优的,即在这
此文档下载收益归作者所有