厦门大学计算机科学系

厦门大学计算机科学系

ID:21166759

大小:1.19 MB

页数:57页

时间:2018-10-20

厦门大学计算机科学系_第1页
厦门大学计算机科学系_第2页
厦门大学计算机科学系_第3页
厦门大学计算机科学系_第4页
厦门大学计算机科学系_第5页
资源描述:

《厦门大学计算机科学系》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、厦门大学计算机科学系2011年10月林子雨厦门大学计算机科学系E-mail:ziyulin@xmu.edu.cn分布式数据库技术 专题二数据分布专题二数据分布厦门大学计算机科学系研究生课程《分布式数据库技术》专题二数据分布第3章数据分布3.1数据分布概念3.2数据划分原则及分片方法3.3数据分配原则及方法3.4数据分布结构模式定义3.1数据分布概念3.1.1.分布式数据库设计的任务3.1.2.数据分布概念3.1.3集中式数据库的关系模式及形式化定义3.1.4.分布式数据库的模式定义3.1.1分布式数据库设计的任务(1)数据库设计数据库设计是指:对于一个给定的应用环境,构造最优的数据库模

2、式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求)。3.1.1分布式数据库设计的任务(2)分布式数据库设计的任务分布式数据库设计包含以下任务:定义全局数据库的概念模式设计分片设计片段的分配设计物理数据库,将概念模式映射到存储区域,并确定适当的存储方法在分布式数据库设计过程中,必须考虑分布式数据库应用的需求,包括:应用提交的场地、应用执行的频度、每个应用所存取数据的类型、次数及统计分布等信息应该明确分布式数据库系统设计的基本策略:从顶向下的设计处理或者从下向上的设计处理3.1.2数据分布概念数据分布的概念逻辑上将全局概念模式(即全局关系模式)

3、,划分成若干逻辑片段(子关系);再按一定的冗余度将片段分配到各个节点上,这时逻辑片段就成为具体的物理片段。3.1.3集中数据库的关系模式及形式化定义为了讨论分布式数据库的模式定义,首先复习相关知识点。(1)关系定义3.1:域是一组具有相同数据类型的值的集合。用{}表示。定义3.2:给定一组域D1,D2,…,Dn,这些域中,可以有相同的。其中D1,D2,…,Dn的笛卡儿积为:D1×D2×…×Dn={(d1,d2,…,dn)

4、di∈Di,i=1,2,…,n}其中每一个元素(d1,d2,…,dn)叫做一个n元组(或元组),元素中的每一个值di叫做一个分量笛卡儿积的基数为

5、D1

6、×

7、D2

8、×…

9、×

10、Dn

11、定义3.3:D1×D2×…×Dn的子集叫做在D1,D2,…,Dn域上的关系,表示为:R(D1,D2,…,Dn)其中,R表示关系名,n是关系的目(或称为度)。3.1.3集中数据库的关系模式及形式化定义笛卡尔积可表示为一个二维表。表中每行对应一个元组,表中的每列对应一个域。例1:给出三个域:D1=导师集合SUPERVISOR=张清玫,刘逸D2=专业集合SPECIALITY=计算机专业,信息专业D3=研究生集合POSTGRADUATE=李勇,刘晨,王敏则D1,D2,D3的笛卡尔积为:D1×D2×D3={(张清玫,计算机专业,李勇),(张清玫,计算机专业,刘晨),(张清玫,计算机专业

12、,王敏),(张清玫,信息专业,李勇),(张清玫,信息专业,刘晨),(张清玫,信息专业,王敏),(刘逸,计算机专业,李勇),(刘逸,计算机专业,刘晨),(刘逸,计算机专业,王敏),(刘逸,信息专业,李勇),(刘逸,信息专业,刘晨),(刘逸,信息专业,王敏)}其中(张清玫,计算机专业,李勇)、(张清玫,计算机专业,刘晨)等都是元组。张清玫、计算机专业、李勇、刘晨等都是分量。3.1.3集中数据库的关系模式及形式化定义该笛卡尔积的基数为2×2×3=12,也就是说,D1×D2×D3一共有2×2×3=12个元组。这12个元组可列成一张二维表,如下:D1,D2,D3的笛卡尔积SUPERVISORSP

13、ECIALITYPOSTGRADUATE张清玫张清玫张清玫张清玫张清玫张清玫刘逸刘逸刘逸刘逸刘逸刘逸计算机专业计算机专业计算机专业信息专业信息专业信息专业计算机专业计算机专业计算机专业信息专业信息专业信息专业李勇刘晨王敏李勇刘晨王敏李勇刘晨王敏李勇刘晨王敏3.1.3集中数据库的关系模式及形式化定义定义3.3说明:若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为侯选码。若一个关系有多个侯选码,则选定其中一个为主码(PrimaryKey)。主码的诸属性称为主属性(Primeattribute)。不包含在任何侯选码中的属性称为非码属性(Non-keyattribute)。在最简单

14、的情况下,侯选码只包含一个属性;在最极端的情况下,关系模式的所有属性组是这个关系模式的侯选码;上述称为全码(All-key)。关系是一个二维表,表的每行对应一个元组,表的每一列对应一个域。3.1.3集中数据库的关系模式及形式化定义(2)关系模式定义3.4:关系的描述称为关系模式。它可以形式化地表示为:R(U,D,dom,F)其中:R为关系名,U为组成该关系的属性名集合,D为属性组U中属性所来自的域,dom为属性向域的映象的集合,F为属性间数据的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。